INDEX
Negative Logits
翁
-0.08
zwar
-0.08
toilets
-0.07
corps
-0.07
sorgen
-0.07
harsh
-0.07
тав
-0.07
ergency
-0.07
cotton
-0.07
arbeiten
-0.07
POSITIVE LOGITS
מאל
0.09
Paramount
0.08
leges
0.08
Nueva
0.07
.Gu
0.07
uchun
0.07
Мне
0.07
سوى
0.07
bate
0.07
Erd
0.07
Activations Density 0.010%