INDEX
Negative Logits
Cam
-0.09
�
-0.08
nut
-0.08
Mm
-0.08
Prestige
-0.07
sedation
-0.07
య్య
-0.07
oops
-0.07
Cort
-0.07
మార
-0.07
POSITIVE LOGITS
acl
0.09
�
0.08
יג
0.08
entails
0.08
مص
0.08
diffus
0.07
ாண
0.07
_REV
0.07
Grind
0.07
directing
0.07
Activations Density 0.025%