INDEX
Negative Logits
CK
-0.08
grunt
-0.08
♀
-0.08
fascination
-0.07
krom
-0.07
었
-0.07
ć
-0.07
Guidance
-0.07
Little
-0.07
-er
-0.07
POSITIVE LOGITS
итан
0.09
MGM
0.08
structur
0.08
0.08
directly
0.07
inisekisa
0.07
conduz
0.07
reality
0.07
configurations
0.07
cooking
0.07
Activations Density 0.000%