INDEX
Negative Logits
victory
-0.08
battle
-0.07
Plac
-0.07
indiqu
-0.07
垃圾
-0.07
importer
-0.07
.Dat
-0.07
Mermaid
-0.07
ка
-0.07
ækker
-0.07
POSITIVE LOGITS
torque
0.09
voorzichtig
0.08
appreci
0.08
progressively
0.08
creciente
0.08
ratt
0.08
oment
0.08
vény
0.08
Torque
0.08
Ross
0.08
Activations Density 0.002%