INDEX
Explanations
traditional [national origin]
New Auto-Interp
Negative Logits
ประเทศ
1.07
ประเทศ
0.90
நாட்டில்
0.87
India
0.82
ভারতবর্ষে
0.82
landet
0.80
மாநிலத்தில்
0.78
দেশে
0.78
நாடு
0.78
Russia
0.77
POSITIVE LOGITS
Italian
2.08
American
1.99
French
1.94
Mexican
1.90
Italian
1.89
Vietnamese
1.85
German
1.84
Egyptian
1.83
Irish
1.81
Danish
1.80
Activations Density 0.216%