INDEX
Negative Logits
ATALOG
-0.08
Lic
-0.07
Bonnie
-0.07
我们应该
-0.07
令牌
-0.07
electron
-0.07
geometric
-0.07
的经历
-0.07
Cho
-0.06
咪
-0.06
POSITIVE LOGITS
⏭
0.08
refer
0.07
首先是
0.07
רב
0.07
preceded
0.07
Yankee
0.07
敗
0.07
🐪
0.07
淝
0.07
現場
0.07
Activations Density 1.126%