INDEX
Negative Logits
snake
-0.06
consultations
-0.06
ibu
-0.06
ician
-0.06
ladatel
-0.06
resonance
-0.06
administering
-0.06
地球
-0.06
nce
-0.06
breasts
-0.05
POSITIVE LOGITS
AL
0.07
REALLY
0.06
Cox
0.06
(mid
0.06
Woody
0.06
и
0.06
'S
0.06
사람들이
0.06
HomeAs
0.06
_True
0.06
Activations Density 0.001%