INDEX
Negative Logits
othes
-0.08
Waarom
-0.08
sanés
-0.07
DESC
-0.07
pero
-0.07
Lehrer
-0.07
्यता
-0.07
_FE
-0.07
PRESS
-0.07
آماده
-0.07
POSITIVE LOGITS
Amish
0.08
xz
0.07
miscar
0.07
Spell
0.07
_spell
0.07
electroph
0.07
_sentence
0.07
intervenir
0.07
zum
0.07
buiten
0.07
Activations Density 0.080%