INDEX
Negative Logits
,is
-0.08
имент
-0.07
spont
-0.07
achelor
-0.07
approached
-0.07
maternity
-0.07
ở
-0.07
図
-0.07
оны
-0.07
disent
-0.07
POSITIVE LOGITS
loyal
0.10
之一
0.09
伴
0.08
duo
0.08
紧
0.08
accompany
0.07
知
0.07
密
0.07
questioning
0.07
prosecut
0.07
Activations Density 0.014%