INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    %↵↵
    -0.07
    iren
    -0.07
     fst
    -0.06
    reas
    -0.06
    zv
    -0.06
    ificant
    -0.06
    |(
    -0.06
    Fin
    -0.06
    елення
    -0.06
    uitar
    -0.06
    POSITIVE LOGITS
     Micha
    0.07
     TEST
    0.06
    /c
    0.06
     getY
    0.06
     cân
    0.06
     spolup
    0.06
     getModel
    0.06
     Кам
    0.06
     ніч
    0.06
     υπό
    0.06
    Act Density 0.000%

    No Known Activations