INDEX
Negative Logits
Little
-0.08
Finger
-0.08
electro
-0.08
Rose
-0.08
jó
-0.08
reform
-0.07
FMC
-0.07
Orange
-0.07
Electro
-0.07
concepts
-0.07
POSITIVE LOGITS
εν
0.08
ney
0.08
.dir
0.08
$q
0.08
seper
0.08
unaffected
0.08
qb
0.07
halves
0.07
-dir
0.07
_dir
0.07
Activations Density 0.006%