INDEX
Negative Logits
outrage
-0.07
_soft
-0.06
Playing
-0.06
chase
-0.06
embraces
-0.06
swing
-0.06
yg
-0.06
-action
-0.06
Reyes
-0.06
oseconds
-0.06
POSITIVE LOGITS
fertile
0.07
fertility
0.07
tility
0.07
ertility
0.07
ILITY
0.07
detergent
0.06
ných
0.06
Αλ
0.06
的地
0.06
aret
0.06
Activations Density 0.006%