INDEX
Negative Logits
quito
-0.08
canta
-0.08
digit
-0.08
digest
-0.07
Passive
-0.07
_digit
-0.07
-0.07
Letter
-0.07
Schn
-0.07
combust
-0.07
POSITIVE LOGITS
forty
0.09
旅
0.08
xxxx
0.08
stvar
0.08
rodents
0.07
:url
0.07
」の
0.07
」を
0.07
٥
0.07
」で
0.07
Activations Density 0.032%