INDEX
Negative Logits
!--
-0.09
(--
-0.08
ighty
-0.07
ở
-0.07
jit
-0.07
ในการ
-0.07
(stream
-0.07
fairs
-0.07
Enable
-0.07
vun
-0.07
POSITIVE LOGITS
рас
0.08
تم
0.08
�
0.08
transgender
0.07
топлива
0.07
0.07
�
0.07
наук
0.07
Infl
0.07
indäki
0.07
Activations Density 0.003%