INDEX
Negative Logits
sas
-0.10
soul
-0.08
nf
-0.08
.fin
-0.08
spin
-0.07
lint
-0.07
Mai
-0.07
203
-0.07
infr
-0.07
заключ
-0.07
POSITIVE LOGITS
なく
0.09
�
0.08
様
0.08
暴
0.08
🏼
0.08
松
0.08
�
0.08
-sama
0.07
ひ
0.07
cabe
0.07
Activations Density 0.015%
sas
soul
nf
.fin
spin
lint
Mai
203
infr
заключ
なく
�
様
暴
🏼
松
�
-sama
ひ
cabe