INDEX
    Explanations

    discussion of film criticism and analysis

    New Auto-Interp
    Negative Logits
     Verfüg
    -0.23
     Möglich
    -0.20
     nackte
    -0.19
     Ihren
    -0.19
     Antworten
    -0.18
     buurt
    -0.18
     aktuellen
    -0.17
     nø
    -0.17
     Bav
    -0.17
     erotische
    -0.17
    POSITIVE LOGITS
     der
    0.20
    basis
    0.19
     die
    0.18
     mit
    0.18
     dies
    0.18
     gut
    0.17
     als
    0.17
    orts
    0.17
     im
    0.17
    unge
    0.17
    Act Density 0.550%

    No Known Activations