INDEX
Negative Logits
apres
-0.08
병
-0.08
elta
-0.07
Veröffentlichung
-0.07
wap
-0.07
نال
-0.07
Cin
-0.07
Aqu
-0.07
Gle
-0.07
(pe
-0.07
POSITIVE LOGITS
emitir
0.08
fragt
0.08
history
0.07
sklearn
0.07
chanting
0.07
Forbidden
0.07
promoters
0.07
controversial
0.07
েয়ে
0.07
বির
0.07
Activations Density 0.000%