INDEX
Negative Logits
gf
-0.09
Profesional
-0.09
LIKE
-0.08
=max
-0.08
positiva
-0.08
obald
-0.08
jala
-0.08
Manche
-0.08
icin
-0.08
Enable
-0.08
POSITIVE LOGITS
disrespect
0.08
/p
0.07
MT
0.07
dishon
0.07
ಪ
0.07
crimes
0.07
manipulating
0.07
交流
0.07
úp
0.07
ads
0.07
Activations Density 0.014%