INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     вкус
    -0.09
    aña
    -0.08
    еним
    -0.07
    enums
    -0.07
     توسط
    -0.07
     مایل
    -0.06
     Willow
    -0.06
    _Request
    -0.06
     Datum
    -0.06
    lineEdit
    -0.06
    POSITIVE LOGITS
     Hollande
    0.06
    .a
    0.06
    лад
    0.06
     Errors
    0.06
     richt
    0.06
     Gür
    0.06
     çek
    0.06
    ода
    0.06
    0.05
     QText
    0.05
    Act Density 0.035%

    No Known Activations