INDEX
Negative Logits
morph
-0.08
tweet
-0.07
ири
-0.07
(tweet
-0.07
Groom
-0.07
endocr
-0.07
Oscar
-0.07
aths
-0.07
(duration
-0.07
针对
-0.07
POSITIVE LOGITS
Lecture
0.09
Lecture
0.08
النه
0.08
Prices
0.08
_ALL
0.08
lecture
0.08
-all
0.08
leister
0.07
fix
0.07
enever
0.07
Activations Density 0.002%