INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ским
    -0.08
    -0.07
     forts
    -0.07
     provision
    -0.07
     given
    -0.07
    รับ
    -0.07
     Bus
    -0.07
    Ent
    -0.07
    _ini
    -0.06
     analysis
    -0.06
    POSITIVE LOGITS
     kjem
    0.09
     meerderheid
    0.09
     રંગ
    0.09
     Updates
    0.09
     अपडेट
    0.08
     شنبه
    0.08
     बिट
    0.08
     updates
    0.08
    -grey
    0.08
     газа
    0.08
    Act Density 0.003%

    No Known Activations