INDEX
Negative Logits
아니
-0.09
pb
-0.08
ize
-0.08
아�
-0.08
idable
-0.08
타입
-0.08
imeters
-0.07
.pb
-0.07
ismatch
-0.07
아니라
-0.07
POSITIVE LOGITS
以来
0.10
久
0.09
oral
0.09
horse
0.08
ध्यान
0.08
bénévol
0.08
rend
0.07
Been
0.07
gente
0.07
Kool
0.07
Activations Density 0.027%