INDEX
Negative Logits
tier
-0.08
buffer
-0.08
struggles
-0.08
pag
-0.08
outlets
-0.08
scrub
-0.08
ramp
-0.07
struggle
-0.07
wrappers
-0.07
alien
-0.07
POSITIVE LOGITS
_cm
0.08
Nes
0.07
unanim
0.07
ферен
0.07
идеально
0.07
-century
0.07
Couples
0.07
доб
0.07
Using
0.07
're
0.07
Activations Density 0.001%