INDEX
Negative Logits
�
-0.08
啜
-0.07
нем
-0.07
libertin
-0.07
แห
-0.07
🇲
-0.07
pledge
-0.06
졸
-0.06
מחזיק
-0.06
.anim
-0.06
POSITIVE LOGITS
服从
0.08
甚至是
0.07
.isfile
0.07
村里
0.07
输入
0.07
overlap
0.07
汇报
0.06
北京市
0.06
ثبت
0.06
比较大
0.06
Activations Density 0.024%