INDEX
Negative Logits
ಈ
-0.09
ಒ
-0.08
شارك
-0.08
舒服
-0.08
ഈ
-0.08
wettelijke
-0.08
ressive
-0.08
>=
-0.08
hew
-0.08
ఈ
-0.08
POSITIVE LOGITS
foes
0.08
beings
0.08
threats
0.08
villains
0.08
अच्छ
0.08
hack
0.08
prank
0.08
threat
0.08
hacker
0.08
strange
0.08
Activations Density 0.059%