INDEX
Explanations
gender, rights, and social issues
New Auto-Interp
Negative Logits
horsepower
0.62
ambitious
0.61
time
0.59
payments
0.53
約
0.53
payroll
0.52
lease
0.52
timely
0.51
finance
0.51
bargain
0.51
POSITIVE LOGITS
സ്ത്രീ
0.79
ennzeichnet
0.69
Infantil
0.68
Heter
0.67
Feminist
0.67
নারী
0.66
துன்ப
0.66
বাধিকার
0.66
ด่า
0.66
عورت
0.65
Activations Density 0.814%