INDEX
Negative Logits
tc
-0.07
Eck
-0.06
sokak
-0.06
Nack
-0.06
eget
-0.06
楽し
-0.06
-0.06
_inc
-0.06
σχ
-0.06
"c
-0.06
POSITIVE LOGITS
ahrung
0.07
conduct
0.07
humour
0.06
odel
0.06
auses
0.06
Liberia
0.06
vaccinations
0.06
ляет
0.06
Lesson
0.06
rogram
0.06
Activations Density 0.007%