INDEX
Negative Logits
壁
-0.07
wl
-0.06
眼
-0.06
_location
-0.06
insurers
-0.06
ublisher
-0.06
Aws
-0.06
Att
-0.06
koli
-0.06
atetime
-0.06
POSITIVE LOGITS
honeymoon
0.12
ymoon
0.10
прох
0.07
итор
0.07
_each
0.07
Lebanese
0.07
Midwest
0.06
diamond
0.06
_hist
0.06
);↵↵
0.06
Activations Density 0.001%