INDEX
Negative Logits
保护
-0.07
Protection
-0.07
protección
-0.07
protected
-0.07
voda
-0.07
ான
-0.07
reparar
-0.07
enders
-0.07
والإ
-0.07
various
-0.06
POSITIVE LOGITS
ność
0.09
umbuhan
0.08
юсь
0.08
ূপ
0.08
Fors
0.08
หลัก
0.08
Employ
0.08
�
0.08
ulek
0.08
ունակում
0.08
Activations Density 0.000%