INDEX
Negative Logits
Teh
-0.08
ektir
-0.07
роме
-0.07
ावन
-0.07
ampton
-0.07
ucene
-0.06
Allows
-0.06
_population
-0.06
ôi
-0.06
.Flags
-0.06
POSITIVE LOGITS
uzav
0.06
xee
0.06
(cnt
0.06
automát
0.06
,err
0.06
擦
0.06
ние
0.05
特别
0.05
Cler
0.05
iscrimination
0.05
Activations Density 0.001%