INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     робити
    -0.07
     yat
    -0.06
    ايش
    -0.06
    .Dto
    -0.06
     только
    -0.06
    -0.06
     холодиль
    -0.06
     Conexion
    -0.06
     тільки
    -0.06
     Palestin
    -0.06
    POSITIVE LOGITS
     tantr
    0.11
    .<
    0.07
    =__
    0.07
     Richards
    0.06
     subset
    0.06
    ISTS
    0.06
     scouting
    0.06
     Bucket
    0.06
    (enum
    0.06
     nug
    0.06
    Act Density 0.003%

    No Known Activations