INDEX
Negative Logits
eman
-0.08
sun
-0.08
�
-0.08
ful
-0.08
additive
-0.08
Add
-0.07
sustent
-0.07
inh
-0.07
operators
-0.07
marque
-0.07
POSITIVE LOGITS
Proble
0.08
Kont
0.08
반
0.07
fine
0.07
rebels
0.07
Trab
0.07
Saint
0.07
_comp
0.07
Convention
0.07
Hence
0.07
Activations Density 0.103%