INDEX
Negative Logits
алав
-0.09
aczego
-0.09
abak
-0.09
lilik
-0.08
უფ
-0.08
�
-0.08
consumo
-0.08
consentimiento
-0.08
consenso
-0.08
արագ
-0.08
POSITIVE LOGITS
atar
0.08
atro
0.08
,两
0.07
.Put
0.07
자로
0.07
aparelhos
0.06
_sat
0.06
than
0.06
oper
0.06
Cycl
0.06
Activations Density 0.001%