INDEX
Negative Logits
_codigo
-0.06
PH
-0.06
()));↵
-0.06
mention
-0.06
kullan
-0.06
_GEN
-0.06
_AUD
-0.06
AC
-0.06
porno
-0.06
-0.06
POSITIVE LOGITS
ř
0.07
anx
0.07
이지
0.07
yr
0.07
드
0.07
Εν
0.07
رج
0.06
mutlu
0.06
otation
0.06
APC
0.06
Activations Density 0.000%