INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     rhetoric
    -0.08
     enthousiaste
    -0.08
    ück
    -0.08
    _percentage
    -0.08
    qh
    -0.08
    ース
    -0.08
     déclaré
    -0.08
    ary
    -0.07
    -Val
    -0.07
     youngest
    -0.07
    POSITIVE LOGITS
     inhab
    0.08
     edu
    0.08
     haus
    0.07
     unimaginable
    0.07
     heading
    0.07
     Vorm
    0.07
     nimi
    0.07
     Transporte
    0.07
    iteli
    0.07
     Karten
    0.07
    Act Density 0.000%

    No Known Activations