INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     browned
    -0.08
    krut
    -0.07
    Pow
    -0.07
    polit
    -0.07
    mor
    -0.07
    crop
    -0.07
    فى
    -0.07
    drž
    -0.07
    Affected
    -0.07
    รับ
    -0.07
    POSITIVE LOGITS
     urge
    0.09
     phenomenal
    0.08
     تک
    0.08
    时期
    0.08
    /gen
    0.08
    722
    0.07
    өн
    0.07
     urged
    0.07
     Peg
    0.07
     genera
    0.07
    Act Density 0.004%

    No Known Activations