INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     roofs
    -0.08
     ment
    -0.07
     pren
    -0.07
     жары
    -0.07
    _USE
    -0.07
     diploma
    -0.07
     Jan
    -0.07
     transf
    -0.07
    Sir
    -0.07
     dirigida
    -0.07
    POSITIVE LOGITS
    Jed
    0.07
     Elton
    0.07
     Extr
    0.07
    ikov
    0.07
    laufen
    0.07
    soap
    0.07
     Ir
    0.07
    ted
    0.07
    nut
    0.07
     zircon
    0.07
    Act Density 0.005%

    No Known Activations