INDEX
Explanations
first-person singular pronoun
New Auto-Interp
Negative Logits
𝐢
-1.90
你就
-1.75
ندار
-1.70
你是不是
-1.52
那你
-1.50
xxiv
-1.46
esquer
-1.45
territo
-1.45
べし
-1.44
你说
-1.43
POSITIVE LOGITS
I
8.63
אני
3.81
my
3.77
tôi
3.70
ผม
3.23
я
3.20
me
2.92
мне
2.77
私は
2.75
jsem
2.66
Activations Density 2.289%