INDEX
Negative Logits
stuff
-0.08
Specials
-0.07
sts
-0.07
ene
-0.07
事情
-0.07
stuff
-0.07
Them
-0.07
Explained
-0.07
Together
-0.07
crus
-0.07
POSITIVE LOGITS
else
0.11
_else
0.11
else
0.10
else
0.10
Conversely
0.09
아니라
0.09
Else
0.09
elif
0.08
elsif
0.08
Convers
0.08
Activations Density 0.016%