INDEX
Negative Logits
Principal
-0.08
principal
-0.07
_
-0.07
vat
-0.07
is
-0.07
mythical
-0.07
Fleet
-0.07
vigor
-0.07
principal
-0.07
given
-0.07
POSITIVE LOGITS
poka
0.09
nende
0.09
최근
0.08
不好
0.08
nisu
0.08
кроме
0.08
recentes
0.08
ăr
0.08
przyp
0.08
CTRL
0.08
Activations Density 0.001%