INDEX
Negative Logits
Pamela
-0.08
TC
-0.08
affiliate
-0.08
craz
-0.08
nors
-0.08
กัน
-0.07
ին
-0.07
-0.07
建
-0.07
าห์
-0.07
POSITIVE LOGITS
fox
0.08
豆
0.08
ప్ప
0.07
iot
0.07
Cet
0.07
Fox
0.07
Дон
0.07
bri
0.07
dri
0.07
Cet
0.07
Activations Density 0.009%