INDEX
Negative Logits
290
-0.08
with
-0.07
kill
-0.07
acting
-0.07
avid
-0.07
equipado
-0.07
Trash
-0.07
valor
-0.07
358
-0.07
so
-0.07
POSITIVE LOGITS
hiv
0.09
乳
0.08
сама
0.08
мужа
0.08
असून
0.08
ٍ
0.08
декабря
0.08
административ
0.08
alaga
0.08
ب
0.07
Activations Density 0.004%