INDEX
Negative Logits
mantle
-0.08
ಗೆ
-0.07
hinweg
-0.07
awsze
-0.07
meu
-0.07
overr
-0.07
auspiel
-0.07
airing
-0.07
ophen
-0.07
electric
-0.07
POSITIVE LOGITS
Heb
0.09
prema
0.09
hacia
0.08
ndaj
0.08
nex
0.08
ivity
0.08
propos
0.08
len
0.07
alas
0.07
hostility
0.07
Activations Density 0.006%