INDEX
Negative Logits
kne
-0.09
reger
-0.08
savor
-0.08
prostitutes
-0.08
sauté
-0.08
vál
-0.08
crossorigin
-0.08
dancers
-0.08
sandwich
-0.08
obey
-0.08
POSITIVE LOGITS
underserved
0.14
rural
0.10
rurales
0.09
Rural
0.09
农村
0.09
где
0.08
disparities
0.08
élo
0.08
哪里
0.08
nơi
0.08
Activations Density 0.042%