INDEX
Negative Logits
medieval
-0.09
Means
-0.08
Proceed
-0.07
小儿
-0.07
INU
-0.07
王晓
-0.07
엷
-0.07
主要
-0.07
wes
-0.07
嚴重
-0.06
POSITIVE LOGITS
refreshed
0.07
ȧ
0.07
晅
0.07
合伙人
0.07
碚
0.07
(exc
0.07
תחושה
0.07
GX
0.07
青岛
0.07
发现问题
0.07
Activations Density 0.016%