INDEX
Negative Logits
ʻo
-0.08
Guan
-0.08
IRO
-0.08
ervo
-0.07
वा
-0.07
Fuji
-0.07
siji
-0.07
joie
-0.07
Igu
-0.07
चना
-0.07
POSITIVE LOGITS
catering
0.08
الرد
0.08
apache
0.08
을
0.08
pupil
0.07
barb
0.07
تع
0.07
について
0.07
dressed
0.07
fark
0.07
Activations Density 0.007%