INDEX
Negative Logits
ชม
-0.08
落户
-0.08
것으로
-0.08
Legendary
-0.07
advantages
-0.07
体育
-0.07
حكم
-0.07
vicious
-0.07
健
-0.07
现身
-0.07
POSITIVE LOGITS
탸
0.07
которую
0.07
istributor
0.07
阿拉
0.07
polic
0.07
漉
0.06
Пар
0.06
ワ
0.06
딪
0.06
międzynar
0.06
Activations Density 0.001%