INDEX
Negative Logits
475
-0.07
hound
-0.06
145
-0.06
Language
-0.06
week
-0.06
難
-0.06
Cathy
-0.06
러
-0.06
.medium
-0.06
SD
-0.06
POSITIVE LOGITS
Coron
0.09
roma
0.08
Goldman
0.08
Corona
0.07
iron
0.07
alta
0.07
coron
0.07
orbs
0.07
orno
0.07
oningen
0.07
Activations Density 0.002%