INDEX
Negative Logits
Short
-0.08
Dear
-0.08
kasa
-0.08
licenci
-0.08
inoc
-0.08
쪽
-0.08
届け
-0.07
kam
-0.07
Co
-0.07
іт
-0.07
POSITIVE LOGITS
dara
0.08
domin
0.08
centred
0.07
Durchführung
0.07
rog
0.07
Hidalgo
0.07
രണ
0.07
продолжа
0.07
oppos
0.07
ara
0.07
Activations Density 0.000%