INDEX
Negative Logits
Sche
-0.08
Ty
-0.08
spě
-0.07
-0.07
force
-0.07
Closed
-0.07
Late
-0.07
indexed
-0.07
listed
-0.07
Ve
-0.07
POSITIVE LOGITS
הלא
0.10
steps
0.09
Schritte
0.09
Vorge
0.09
ลี่ย
0.09
действий
0.09
步骤
0.08
कदम
0.08
หลัง
0.08
行动
0.08
Activations Density 0.014%