INDEX
Negative Logits
emiss
-0.09
Ber
-0.08
ع
-0.08
uen
-0.08
Á
-0.07
gw
-0.07
composed
-0.07
sinn
-0.07
eff
-0.07
HK
-0.07
POSITIVE LOGITS
Sat
0.08
rub
0.08
бума
0.07
drivers
0.07
saja
0.07
sat
0.07
engan
0.07
dama
0.07
Myself
0.07
WER
0.07
Activations Density 0.002%