INDEX
Negative Logits
,道
-0.08
SPR
-0.07
ț
-0.07
ly
-0.07
WAR
-0.07
б
-0.07
?><
-0.07
.tax
-0.07
Bat
-0.07
lad
-0.07
POSITIVE LOGITS
pans
0.09
Rise
0.08
Aust
0.08
graz
0.08
abge
0.08
punct
0.08
Rise
0.08
disadvantaged
0.08
不好
0.08
qay
0.08
Activations Density 0.001%