INDEX
Negative Logits
unicode
-0.09
lena
-0.08
-за
-0.08
commissioner
-0.08
fontsize
-0.08
henn
-0.07
Accord
-0.07
behand
-0.07
pari
-0.07
rig
-0.07
POSITIVE LOGITS
িল
0.08
דה
0.08
�
0.07
সাম
0.07
él
0.07
لاً
0.07
ապ
0.07
ेत
0.07
ակ
0.07
මා
0.07
Activations Density 0.512%