INDEX
Negative Logits
494
-0.09
òn
-0.08
(off
-0.07
esp
-0.07
angles
-0.07
serotonin
-0.07
_Error
-0.07
العرب
-0.07
ہو
-0.07
授
-0.07
POSITIVE LOGITS
том
0.10
pires
0.08
teste
0.08
cle
0.08
cle
0.08
серв
0.08
vit
0.08
খ
0.07
помощью
0.07
тар
0.07
Activations Density 0.004%