INDEX
Explanations
syntactic structures and relationships in narrative or descriptive contexts
New Auto-Interp
Negative Logits
keinen
-0.19
Den
-0.18
Ihren
-0.18
kleinen
-0.18
unseren
-0.18
eigenen
-0.17
Den
-0.17
einen
-0.17
ниÑĨÑĥ
-0.17
seinen
-0.16
POSITIVE LOGITS
es
0.43
die
0.38
das
0.34
sie
0.30
die
0.28
diese
0.28
dies
0.24
das
0.23
'es
0.22
_die
0.22
Activations Density 0.026%