INDEX
Negative Logits
写
-0.07
_hello
-0.07
POP
-0.07
boats
-0.06
erotic
-0.06
例如
-0.06
Deutsche
-0.06
_foot
-0.06
compar
-0.06
reproductive
-0.06
POSITIVE LOGITS
margin
0.11
Margin
0.09
margin
0.09
margins
0.09
Mason
0.08
Margin
0.08
Carson
0.08
ions
0.08
Ramp
0.07
Morgan
0.07
Activations Density 0.008%