INDEX
Negative Logits
ⴽ
-0.07
دين
-0.07
Qual
-0.07
𬳵
-0.07
seasoned
-0.07
_DIS
-0.07
pj
-0.06
_ps
-0.06
Differences
-0.06
쨈
-0.06
POSITIVE LOGITS
écrit
0.08
VII
0.07
同志们
0.07
印刷
0.07
sagte
0.07
lid
0.07
褴
0.07
学前
0.07
解决方案
0.07
poster
0.06
Activations Density 0.003%