INDEX
Negative Logits
.gov
-0.08
_ME
-0.07
混
-0.07
.edu
-0.06
.endDate
-0.06
любов
-0.06
WidthSpace
-0.06
-↵↵
-0.06
样
-0.06
#[
-0.06
POSITIVE LOGITS
cks
0.07
bere
0.07
(Editor
0.06
nieu
0.06
naturally
0.06
__;
0.06
.Chat
0.06
Norris
0.06
cortex
0.06
_ini
0.06
Activations Density 0.012%