INDEX
Negative Logits
ിക്ക്
-0.08
669
-0.08
しか
-0.07
èles
-0.07
oucou
-0.07
是谁
-0.07
Steele
-0.07
alphabet
-0.07
outlet
-0.07
ీల
-0.07
POSITIVE LOGITS
kow
0.08
Karn
0.08
txn
0.08
retr
0.07
Sey
0.07
dais
0.07
generic
0.07
άζ
0.07
heterosexual
0.07
مد
0.07
Activations Density 0.002%