INDEX
Negative Logits
Rapids
-0.09
सर
-0.09
law
-0.08
rapproche
-0.08
cker
-0.08
hrad
-0.07
intervention
-0.07
handicap
-0.07
reliant
-0.07
Coach
-0.07
POSITIVE LOGITS
प्रत
0.08
قول
0.08
قال
0.07
�
0.07
repair
0.07
ات
0.07
edil
0.07
ito
0.07
沈
0.07
acas
0.07
Activations Density 0.002%