INDEX
Negative Logits
etem
-0.09
Nancy
-0.09
igné
-0.09
nám
-0.08
anmeld
-0.08
.gridx
-0.08
beruf
-0.08
größten
-0.08
Carmen
-0.08
няй
-0.08
POSITIVE LOGITS
manually
0.10
(
0.09
manual
0.08
or
0.08
Manual
0.08
empir
0.08
empirical
0.08
directly
0.08
manual
0.08
Manual
0.07
Activations Density 0.180%