INDEX
Negative Logits
prop
-0.07
セ
-0.07
�
-0.07
BREAK
-0.07
dow
-0.06
renal
-0.06
改革
-0.06
’an
-0.06
減
-0.06
header
-0.06
POSITIVE LOGITS
lagi
0.06
quisition
0.06
Corruption
0.06
arena
0.06
Telegram
0.06
Terrorism
0.06
forme
0.06
onse
0.06
goalt
0.06
Toolkit
0.06
Activations Density 0.111%