INDEX
Negative Logits
잨
-0.08
晨报
-0.08
ཁ
-0.07
铧
-0.07
_malloc
-0.07
靓丽
-0.06
בח
-0.06
raft
-0.06
立法
-0.06
充足
-0.06
POSITIVE LOGITS
.CL
0.08
سوريا
0.07
_ur
0.07
追捧
0.07
acept
0.07
yönet
0.07
学
0.07
去了
0.07
]').
0.07
_follow
0.07
Activations Density 0.002%