INDEX
Negative Logits
அவரது
-0.09
അദ്ദേഹ
-0.09
ฐาน
-0.09
пациента
-0.09
Hath
-0.09
அவர்
-0.08
οικο
-0.08
他
-0.08
罪
-0.08
그는
-0.08
POSITIVE LOGITS
Salvador
0.10
libert
0.10
Ung
0.10
Libert
0.09
Mens
0.09
Ung
0.09
omes
0.08
Red
0.08
Mens
0.08
Servo
0.08
Activations Density 0.003%