INDEX
Explanations
pronoun "they" after list items
New Auto-Interp
Negative Logits
seine
0.85
ಅವನ
0.83
jej
0.78
తన
0.74
ඔහුගේ
0.73
jego
0.73
自身の
0.71
인의
0.71
അതിന്റെ
0.71
ችል
0.71
POSITIVE LOGITS
they
6.69
They
6.46
They
6.40
mereka
6.39
they
6.27
他们
6.10
они
6.06
вони
5.72
他們
5.66
họ
5.52
Activations Density 1.070%