INDEX
Negative Logits
gant
-0.08
praw
-0.07
kach
-0.07
nw
-0.07
flower
-0.07
Ł
-0.07
pellet
-0.07
vär
-0.07
nä
-0.07
yh
-0.07
POSITIVE LOGITS
incom
0.08
삼
0.08
SRC
0.08
Amber
0.07
rede
0.07
�
0.07
�
0.07
.jsx
0.07
honest
0.07
Creator
0.07
Activations Density 0.001%