INDEX
Negative Logits
confines
-0.08
颛
-0.07
Populate
-0.07
ѩ
-0.07
领衔
-0.07
humiliating
-0.07
无缘
-0.06
婚姻
-0.06
przedsiębiorc
-0.06
<SpriteRenderer
-0.06
POSITIVE LOGITS
Fiat
0.08
Dat
0.07
บางคน
0.07
สงบ
0.07
0.07
w
0.07
często
0.07
_COM
0.07
Sorted
0.07
림
0.06
Activations Density 0.005%