INDEX
Negative Logits
추
-0.07
그대로
-0.07
凝
-0.07
来说
-0.07
wedge
-0.07
hashtag
-0.07
keen
-0.07
영
-0.07
эффективность
-0.07
势
-0.07
POSITIVE LOGITS
.nb
0.08
Slee
0.08
SEC
0.08
late
0.07
late
0.07
Pest
0.07
SEC
0.07
classmates
0.07
pest
0.07
Kim
0.07
Activations Density 0.011%