INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     beaucoup
    -0.07
     Orig
    -0.07
    yi
    -0.07
     Над
    -0.06
     Bren
    -0.06
    (old
    -0.06
     rog
    -0.06
     acute
    -0.06
     Kra
    -0.06
    (ns
    -0.06
    POSITIVE LOGITS
     Ngân
    0.07
    ItemImage
    0.07
    apsible
    0.07
    0.06
    cord
    0.06
    --
    0.06
    database
    0.06
    时候
    0.06
    ستگی
    0.06
    ασία
    0.06
    Act Density 0.002%

    No Known Activations