INDEX
Negative Logits
discover
-0.09
ード
-0.07
ülke
-0.07
Vo
-0.07
Beck
-0.07
趣
-0.07
ely
-0.07
Hay
-0.06
Bell
-0.06
忺
-0.06
POSITIVE LOGITS
thief
0.07
뻡
0.07
phó
0.07
accordance
0.07
稳定性
0.07
ale
0.07
得天
0.07
静静地
0.07
我真的
0.07
太极拳
0.07
Activations Density 0.020%