INDEX
Negative Logits
armies
-0.09
ემ
-0.08
المسلحة
-0.08
ربي
-0.08
uphill
-0.08
Maryland
-0.08
unlike
-0.08
丁
-0.07
落
-0.07
artillery
-0.07
POSITIVE LOGITS
toc
0.08
dano
0.08
bilir
0.08
transplantation
0.08
끼
0.08
Betrieb
0.08
Kate
0.07
182
0.07
257
0.07
metabolism
0.07
Activations Density 0.006%