INDEX
Negative Logits
或
-0.07
арамет
-0.07
�n
-0.06
enf
-0.06
burg
-0.06
सक
-0.06
rog
-0.06
或
-0.06
以外
-0.06
.Parameter
-0.06
POSITIVE LOGITS
вед
0.22
CHAT
0.08
долж
0.07
Supplementary
0.07
.game
0.07
media
0.07
.webkit
0.07
Capt
0.07
SAL
0.06
monday
0.06
Activations Density 0.002%