INDEX
Negative Logits
丸
-0.07
とな
-0.07
entgegen
-0.07
앞
-0.07
Grad
-0.07
.pub
-0.07
こちら
-0.07
(sort
-0.07
如下
-0.07
바로
-0.07
POSITIVE LOGITS
ellant
0.09
Merr
0.09
ден
0.08
kol
0.08
Mighty
0.08
Stanton
0.08
istração
0.08
chair
0.07
nud
0.07
encompass
0.07
Activations Density 0.557%