INDEX
Negative Logits
maktadır
-0.08
Carrie
-0.08
został
-0.08
Lic
-0.08
sogenannten
-0.08
puisqu
-0.08
cutest
-0.08
됩니다
-0.08
fform
-0.08
Ukrain
-0.08
POSITIVE LOGITS
vs
0.17
versus
0.16
vs
0.11
eher
0.10
বন
0.10
_vs
0.10
Conversely
0.09
Vs
0.09
તો
0.09
mı
0.09
Activations Density 0.151%