INDEX
Negative Logits
orig
-0.09
MEC
-0.08
FS
-0.07
Clay
-0.07
Orig
-0.07
aleg
-0.07
полож
-0.07
Obviously
-0.07
Poe
-0.07
hany
-0.07
POSITIVE LOGITS
quieter
0.10
细
0.09
quiet
0.09
silencio
0.09
下来
0.09
Quiet
0.09
তম
0.09
静
0.09
quietly
0.08
quiet
0.08
Activations Density 0.008%