INDEX
Negative Logits
.more
-0.08
HAC
-0.08
্দেশ
-0.08
moz
-0.08
usd
-0.08
.memo
-0.08
001
-0.08
函数
-0.08
atras
-0.08
venc
-0.07
POSITIVE LOGITS
persecution
0.19
persecut
0.15
persec
0.15
diskr
0.11
massac
0.10
genoc
0.10
hostile
0.09
discrimination
0.09
prejudice
0.09
perseg
0.09
Activations Density 0.057%