INDEX
Explanations
references to family relationships and caregiving dynamics
New Auto-Interp
Negative Logits
ISTRIBUT
-0.15
çº
-0.15
und
-0.14
elles
-0.14
und
-0.14
mando
-0.14
Und
-0.14
vår
-0.14
/disable
-0.13
NOWLED
-0.13
POSITIVE LOGITS
dem
0.24
sich
0.23
einem
0.21
einen
0.20
keinen
0.19
es
0.18
vom
0.18
zu
0.18
den
0.18
keine
0.17
Activations Density 0.053%