INDEX
Negative Logits
coexist
-0.08
לא
-0.08
Noord
-0.08
joints
-0.08
georgan
-0.08
ুক
-0.07
publicados
-0.07
나타
-0.07
liberated
-0.07
letion
-0.07
POSITIVE LOGITS
tweak
0.08
slight
0.08
spacing
0.08
impact
0.08
guess
0.08
légèrement
0.08
Impact
0.07
rak
0.07
environs
0.07
Guess
0.07
Activations Density 0.018%