INDEX
Negative Logits
onal
-0.07
ALLENG
-0.07
ائر
-0.07
olics
-0.07
эн
-0.06
"*",
-0.06
agara
-0.06
opathy
-0.06
通知
-0.06
Measures
-0.06
POSITIVE LOGITS
niche
0.18
nich
0.09
ни
0.07
Nich
0.07
looph
0.07
nig
0.06
Inc
0.06
nic
0.06
dive
0.06
_BOTH
0.06
Activations Density 0.002%