INDEX
Negative Logits
_ENTER
-0.07
of
-0.07
tober
-0.07
�
-0.07
ARGIN
-0.07
ัย
-0.07
>
-0.07
_PUSH
-0.07
بغ
-0.07
ừ
-0.07
POSITIVE LOGITS
operated
0.08
ministers
0.07
情报
0.07
昭
0.07
propriet
0.07
prosecutors
0.07
residents
0.07
specialists
0.07
管理模式
0.07
老化
0.07
Activations Density 0.001%