INDEX
Negative Logits
Qué
-0.09
빠
-0.08
GDK
-0.08
"a
-0.08
…it
-0.07
感兴趣的
-0.07
溆
-0.07
Zack
-0.07
郸
-0.07
って
-0.07
POSITIVE LOGITS
乘客
0.07
畜
0.07
UserProfile
0.07
用户
0.07
平民
0.07
直接
0.07
human
0.06
人为
0.06
atinum
0.06
青睐
0.06
Activations Density 0.025%