INDEX
Negative Logits
INGLE
-0.07
mpp
-0.06
ΕΙ
-0.06
shelter
-0.06
tower
-0.06
虚
-0.06
enade
-0.06
EH
-0.06
Tool
-0.06
Requirements
-0.06
POSITIVE LOGITS
_INV
0.07
Maxim
0.07
önlem
0.07
حم
0.06
ousel
0.06
(priv
0.06
.IP
0.06
přest
0.06
ómo
0.06
Koreans
0.06
Activations Density 0.008%