INDEX
Negative Logits
�
-0.08
합
-0.07
_lin
-0.07
stained
-0.07
握
-0.07
HL
-0.07
etrize
-0.07
529
-0.07
나다
-0.07
Pog
-0.07
POSITIVE LOGITS
endl
0.10
'"'
0.09
"\"
0.08
"'"
0.08
endl
0.08
Nana
0.08
Gal
0.07
setw
0.07
Kow
0.07
Tale
0.07
Activations Density 0.004%