INDEX
Negative Logits
Primer
-0.07
.cp
-0.07
rog
-0.06
_week
-0.06
treating
-0.06
РИ
-0.06
Rog
-0.06
poles
-0.06
race
-0.06
Glyph
-0.06
POSITIVE LOGITS
#{0.07
','%
0.06
WORD
0.06
,float
0.06
ag
0.06
VARIANT
0.06
_FAIL
0.06
σσ
0.06
äm
0.06
obscene
0.06
Activations Density 0.006%