INDEX
Negative Logits
真的
-0.10
这么
-0.09
读取
-0.08
发展的
-0.08
הרבה
-0.08
sque
-0.08
很多
-0.08
очки
-0.08
正常
-0.08
够
-0.08
POSITIVE LOGITS
Vanderbilt
0.08
՝
0.07
기업
0.07
namens
0.07
Ling
0.07
Sarat
0.07
Away
0.07
その他
0.07
Voll
0.07
Graz
0.07
Activations Density 0.011%