INDEX
Negative Logits
Entrega
-0.08
Cond
-0.08
ineq
-0.08
aw
-0.08
essay
-0.07
queeze
-0.07
cone
-0.07
Ent
-0.07
empre
-0.07
_cond
-0.07
POSITIVE LOGITS
ذا
0.09
Twilight
0.08
Sherlock
0.08
ётся
0.08
ثال
0.08
Parkinson
0.08
cia
0.07
hacen
0.07
theros
0.07
Tort
0.07
Activations Density 0.006%