INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     orientation
    -0.08
    _orientation
    -0.07
    ొంద
    -0.07
     מצ
    -0.07
     rhythms
    -0.07
    Orientation
    -0.07
     shredd
    -0.07
     anthem
    -0.07
    -0.07
    -0.07
    POSITIVE LOGITS
     Dialog
    0.10
    ®.
    0.09
    _dialog
    0.09
    -dialog
    0.09
    -options
    0.09
    fonds
    0.09
    Dialog
    0.08
     Diskussion
    0.08
    ®
    0.08
    …,
    0.08
    Act Density 0.004%

    No Known Activations