INDEX
Negative Logits
-encoded
-0.08
multip
-0.06
Cy
-0.06
üzerindeki
-0.06
SimpleName
-0.06
Cert
-0.06
为什么
-0.06
slander
-0.06
Key
-0.06
sanct
-0.05
POSITIVE LOGITS
dispositivo
0.07
INFO
0.07
prejudices
0.07
يير
0.07
IDGET
0.07
agascar
0.07
ởi
0.07
processable
0.07
براير
0.07
acific
0.07
Activations Density 0.011%