INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    .).
    -0.06
     někol
    -0.06
     mour
    -0.06
     náv
    -0.06
     освіти
    -0.06
    še
    -0.06
    ")).
    -0.06
     flap
    -0.06
     працівників
    -0.06
    beck
    -0.06
    POSITIVE LOGITS
    editable
    0.07
    fun
    0.07
     cần
    0.06
    StdString
    0.06
    combine
    0.06
    0.06
    -example
    0.06
     appetite
    0.06
    645
    0.06
    0.06
    Act Density 0.000%

    No Known Activations