INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    0.29
    1
    0.27
    вати
    0.27
    7
    0.26
    燃料
    0.25
    i
    0.25
    0.25
    0.25
    ലിയ
    0.25
    0.25
    POSITIVE LOGITS
    t
    0.32
    c
    0.29
     EVENT
    0.27
    folds
    0.26
    ik
    0.26
     flashbacks
    0.26
    ود
    0.26
     colleges
    0.26
     supermarkets
    0.26
    bardziej
    0.26
    Act Density 0.126%

    No Known Activations