INDEX
Negative Logits
$I
-0.08
American
-0.08
Liber
-0.08
North
-0.07
Kal
-0.07
Mayor
-0.07
Contra
-0.07
Take
-0.07
�
-0.07
apat
-0.07
POSITIVE LOGITS
Chang
0.09
ή
0.08
inad
0.08
mite
0.08
regards
0.08
بكل
0.08
0.08
�
0.07
কার
0.07
触
0.07
Activations Density 0.008%