INDEX
Explanations
describing people or animals
New Auto-Interp
Negative Logits
নিজেরাই
1.00
rianças
0.90
הם
0.90
کاربران
0.90
কারীদের
0.89
ższe
0.89
사람들이
0.89
بنات
0.88
它们
0.87
льники
0.87
POSITIVE LOGITS
named
1.57
himself
1.51
nommé
1.43
whom
1.39
sitzt
1.31
bernama
1.29
whose
1.27
ஒருவர்
1.26
who
1.25
statue
1.23
Activations Density 0.721%