INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.08
     Fug
    -0.08
    fluss
    -0.08
    /button
    -0.08
    xed
    -0.07
     Anzeige
    -0.07
    èt
    -0.07
     дек
    -0.07
     Gilles
    -0.07
    acked
    -0.07
    POSITIVE LOGITS
    nz
    0.08
     cottage
    0.08
     RDC
    0.07
     homog
    0.07
     nz
    0.07
     matric
    0.07
    rd
    0.07
     heard
    0.07
     rd
    0.07
    SSR
    0.07
    Act Density 0.005%

    No Known Activations