INDEX
Negative Logits
طفال
-0.06
galement
-0.06
využití
-0.06
FEATURE
-0.06
appName
-0.06
zá
-0.06
valuation
-0.06
глав
-0.06
.appcompat
-0.06
�로
-0.06
POSITIVE LOGITS
obscene
0.09
lcm
0.07
obsc
0.07
decency
0.07
acne
0.07
Deer
0.07
Liberties
0.06
inde
0.06
dancing
0.06
(ids
0.06
Activations Density 0.003%