INDEX
Negative Logits
_sy
-0.09
(ne
-0.08
umen
-0.08
usalem
-0.08
834
-0.08
lips
-0.08
lid
-0.07
fly
-0.07
bilden
-0.07
祥
-0.07
POSITIVE LOGITS
EPS
0.08
VS
0.08
Disclosure
0.08
небольш
0.08
Disclosure
0.07
impulse
0.07
QS
0.07
ally
0.07
dozen
0.07
XS
0.07
Activations Density 0.000%