INDEX
Negative Logits
scrutiny
-0.10
conduire
-0.08
][$
-0.08
compos
-0.07
_conn
-0.07
inu
-0.07
scrutin
-0.07
сая
-0.07
stad
-0.07
Proposition
-0.07
POSITIVE LOGITS
cadáver
0.08
.low
0.08
declarou
0.08
DECLARE
0.08
развед
0.08
tollen
0.08
UW
0.07
wawe
0.07
tradición
0.07
очередь
0.07
Activations Density 0.004%