INDEX
Negative Logits
-0.07
Dis
-0.07
dissect
-0.07
WB
-0.07
Zw
-0.07
elder
-0.07
Kow
-0.07
TEL
-0.07
сб
-0.07
worldwide
-0.07
POSITIVE LOGITS
掉
0.15
лиш
0.09
undue
0.09
一下
0.08
dàng
0.08
ধর্ম
0.08
楚
0.08
Marg
0.08
asen
0.08
菌
0.08
Activations Density 0.005%