INDEX
Negative Logits
stands
-0.08
既
-0.08
šķ
-0.08
.Linear
-0.07
บ
-0.07
nomination
-0.07
CK
-0.07
ifiers
-0.07
探索
-0.07
_reserved
-0.07
POSITIVE LOGITS
minus
0.09
subtract
0.08
爸
0.08
avete
0.08
hai
0.08
yee
0.08
Subtract
0.07
cough
0.07
0.07
西游
0.07
Activations Density 0.008%