INDEX
Negative Logits
ालन
-0.09
мент
-0.09
locality
-0.08
итал
-0.08
litig
-0.08
اقل
-0.08
таш
-0.07
disability
-0.07
sluit
-0.07
agerie
-0.07
POSITIVE LOGITS
after
0.08
vodka
0.07
extensions
0.07
for
0.07
pronounced
0.07
estis
0.07
भनेर
0.07
הג
0.07
channels
0.07
TODO
0.07
Activations Density 0.003%