INDEX
Explanations
importing goods and technology
New Auto-Interp
Negative Logits
ل
1.96
ర్
1.69
вання
1.55
ﻜ
1.52
去
1.50
एस
1.49
്
1.48
вые
1.46
вая
1.46
मियल
1.46
POSITIVE LOGITS
ла
2.05
others
1.66
acht
1.65
ede
1.63
als
1.62
anc
1.56
ate
1.52
ines
1.49
ico
1.48
ile
1.48
Activations Density 0.002%