INDEX
Negative Logits
_pag
-0.08
_TARGET
-0.08
_ABORT
-0.08
Verb
-0.08
verb
-0.07
Pag
-0.07
Vogel
-0.07
nol
-0.07
Black
-0.07
_PROVIDER
-0.07
POSITIVE LOGITS
,与
0.09
奖金
0.09
,因此
0.08
ancement
0.08
,所以
0.08
,其中
0.08
quan
0.08
Interact
0.08
interf
0.08
hone
0.08
Activations Density 0.043%