INDEX
Negative Logits
hormonal
-0.08
gum
-0.08
Gum
-0.08
fruct
-0.07
เซีย
-0.07
ufu
-0.07
origine
-0.07
ць
-0.07
ಾರು
-0.07
വര
-0.07
POSITIVE LOGITS
counterpart
0.08
entitled
0.08
kill
0.07
nicer
0.07
உறுப்ப
0.07
Conservative
0.07
<Unit
0.07
ดี
0.07
representatives
0.07
desirable
0.07
Activations Density 0.004%