INDEX
Explanations
possessive and relational pronouns
New Auto-Interp
Negative Logits
различни
0.47
meeste
0.42
பெரும்பாலும்
0.41
ختلف
0.40
المختلفة
0.40
différents
0.39
разные
0.39
Fees
0.39
diferentes
0.38
farklı
0.38
POSITIVE LOGITS
whose
0.64
الذين
0.63
cuyo
0.54
及其
0.51
such
0.50
whose
0.50
जिनकी
0.50
которые
0.50
cuya
0.50
cujo
0.47
Activations Density 0.041%