INDEX
Negative Logits
masculine
-0.07
дер
-0.06
237
-0.06
239
-0.06
704
-0.06
199
-0.06
contempt
-0.06
OU
-0.06
能够
-0.06
조
-0.06
POSITIVE LOGITS
$/,↵
0.08
eature
0.07
(blog
0.07
/apple
0.06
.parseFloat
0.06
roe
0.06
_fire
0.06
venth
0.06
gebung
0.06
hoa
0.06
Activations Density 0.151%