INDEX
Negative Logits
Pere
-0.08
ægt
-0.08
portfolio
-0.07
bağlı
-0.07
portefeuille
-0.07
oil
-0.07
일이
-0.07
따라서
-0.07
handful
-0.07
دارة
-0.07
POSITIVE LOGITS
Who
0.08
Asp
0.08
autism
0.08
vui
0.08
accommodations
0.08
,text
0.08
273
0.08
848
0.07
armes
0.07
BW
0.07
Activations Density 0.001%