INDEX
Negative Logits
arit
-0.09
imple
-0.08
cene
-0.08
wak
-0.08
clic
-0.08
uckle
-0.08
say
-0.08
izia
-0.08
cale
-0.08
iii
-0.07
POSITIVE LOGITS
raz
0.08
gebeurten
0.08
false
0.08
leopard
0.08
არ�
0.08
false
0.08
આશ
0.08
improbable
0.08
:error
0.08
误
0.08
Activations Density 0.005%