INDEX
Negative Logits
dipl
-0.09
狠狠
-0.08
敢
-0.08
Holt
-0.07
寒
-0.07
lill
-0.07
ack
-0.07
.dim
-0.07
ternoons
-0.07
viz
-0.07
POSITIVE LOGITS
воздействия
0.09
[data
0.09
да
0.08
unite
0.08
[href
0.08
воздейств
0.08
_CONTAINER
0.08
потен
0.08
(trigger
0.08
trigger
0.08
Activations Density 0.003%