INDEX
Negative Logits
lead
-0.09
dace
-0.08
Received
-0.08
755
-0.08
шись
-0.07
141
-0.07
trom
-0.07
_received
-0.07
_area
-0.07
(ci
-0.07
POSITIVE LOGITS
dalej
0.10
régulièrement
0.08
verder
0.08
โม
0.07
გაუ�
0.07
.monitor
0.07
świad
0.07
IGGER
0.07
�
0.07
xuyên
0.07
Activations Density 0.048%