INDEX
Negative Logits
Bran
-0.09
abd
-0.09
ાળ
-0.08
�
-0.08
parm
-0.08
mande
-0.08
promptly
-0.08
.Buffered
-0.08
prid
-0.08
/AP
-0.08
POSITIVE LOGITS
закона
0.08
tering
0.08
требованиям
0.08
нормы
0.08
Hack
0.07
norms
0.07
乎
0.07
expectations
0.07
من
0.07
normativa
0.07
Activations Density 0.077%