INDEX
Negative Logits
ాధ
-0.08
столк
-0.08
successive
-0.08
鸿
-0.08
powers
-0.08
Bany
-0.08
معا
-0.07
firsthand
-0.07
ó
-0.07
traced
-0.07
POSITIVE LOGITS
格式
0.10
Strict
0.10
obey
0.09
Formatting
0.09
Allowed
0.09
FORMAT
0.09
Strict
0.09
规范
0.09
Formatting
0.09
strict
0.09
Activations Density 0.017%