INDEX
Negative Logits
Rak
-0.08
Wedding
-0.08
translation
-0.08
Rak
-0.07
suuren
-0.07
solares
-0.07
Swar
-0.07
kolm
-0.07
niin
-0.07
Nutrition
-0.07
POSITIVE LOGITS
iebt
0.08
альтернатив
0.08
paura
0.08
crap
0.08
partisan
0.08
alternativ
0.08
spared
0.08
الأن
0.08
beast
0.07
abnormal
0.07
Activations Density 0.002%