INDEX
Negative Logits
ubere
-0.08
ا
-0.08
derive
-0.08
싶은
-0.08
लगा
-0.08
morals
-0.07
-equiv
-0.07
-minded
-0.07
ข้อ
-0.07
บาท
-0.07
POSITIVE LOGITS
flo
0.10
Maintenance
0.08
_en
0.07
loha
0.07
Oficina
0.07
Ante
0.07
Maintenance
0.07
Bremen
0.07
магаз
0.07
_sh
0.07
Activations Density 0.002%