INDEX
Negative Logits
eb
-0.09
Bab
-0.09
Mach
-0.07
时候
-0.07
MACH
-0.07
therapeut
-0.07
restit
-0.07
uak
-0.07
oric
-0.07
Commune
-0.07
POSITIVE LOGITS
Bang
0.08
apart
0.08
obo
0.08
Bg
0.08
istic
0.08
vel
0.07
slip
0.07
ifier
0.07
309
0.07
ened
0.07
Activations Density 0.005%