INDEX
Negative Logits
boosting
-0.08
slices
-0.08
pan
-0.08
kri
-0.08
Cas
-0.08
hebben
-0.07
olev
-0.07
norte
-0.07
secr
-0.07
.euler
-0.07
POSITIVE LOGITS
шир
0.08
disciplined
0.08
компанией
0.08
narrowed
0.08
квали
0.08
Rejected
0.08
Clark
0.08
ман
0.08
attorney
0.08
мол
0.08
Activations Density 0.005%