INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    $I
    -0.08
    American
    -0.08
    Liber
    -0.08
    North
    -0.07
    Kal
    -0.07
    Mayor
    -0.07
    Contra
    -0.07
    Take
    -0.07
    -0.07
    apat
    -0.07
    POSITIVE LOGITS
     Chang
    0.09
     ή
    0.08
     inad
    0.08
     mite
    0.08
     regards
    0.08
     بكل
    0.08
    0.08
    0.07
     কার
    0.07
    0.07
    Act Density 0.008%

    No Known Activations