INDEX
Negative Logits
Woman
-0.08
reinc
-0.07
Willy
-0.07
sheath
-0.07
fortress
-0.07
Driving
-0.07
American
-0.07
supra
-0.07
Isabel
-0.07
indiqué
-0.07
POSITIVE LOGITS
Ong
0.08
δια
0.07
ন্ম
0.07
המשחק
0.07
הת
0.07
thin
0.07
Moot
0.07
:)↵↵
0.07
idele
0.07
ijl
0.07
Activations Density 0.002%