INDEX
Negative Logits
Ent
-0.08
Adornment
-0.08
prove
-0.08
profesor
-0.08
xp
-0.07
elib
-0.07
Entropy
-0.07
aceite
-0.07
_fu
-0.07
-confidence
-0.07
POSITIVE LOGITS
beloved
0.09
广大
0.09
annars
0.09
soft
0.09
otherwise
0.09
软
0.08
niile
0.08
那些
0.08
,同时
0.07
burgeoning
0.07
Activations Density 0.098%