INDEX
Negative Logits
吁
-0.07
Տ
-0.07
Submit
-0.07
Дж
-0.07
자
-0.07
Hin
-0.07
')])↵
-0.07
哺
-0.07
/std
-0.07
热心
-0.07
POSITIVE LOGITS
邑
0.08
français
0.07
económ
0.07
สะอา
0.07
وحت
0.07
坎
0.07
.groupControl
0.06
Political
0.06
oğlu
0.06
impacted
0.06
Activations Density 0.001%