INDEX
Negative Logits
strpos
-0.07
Điều
-0.07
지막
-0.07
bourgeois
-0.07
位
-0.07
ninth
-0.07
beige
-0.07
Дмит
-0.06
üretim
-0.06
titten
-0.06
POSITIVE LOGITS
Sc
0.15
sc
0.15
SC
0.14
SC
0.13
Sc
0.12
scam
0.11
.SC
0.10
scams
0.10
sc
0.10
/sc
0.10
Activations Density 0.044%