INDEX
Negative Logits
compet
-0.09
急
-0.08
цій
-0.07
bł
-0.07
conn
-0.07
controller
-0.07
exper
-0.07
مفت
-0.07
corso
-0.07
CONS
-0.07
POSITIVE LOGITS
ינות
0.08
princip
0.08
voces
0.08
занятия
0.07
/Re
0.07
fürs
0.07
gü
0.07
ივ
0.07
-Re
0.07
.Kind
0.07
Activations Density 0.001%