INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Cen
    -0.07
     Exercise
    -0.07
     ty
    -0.07
     emoções
    -0.07
     Erika
    -0.07
     Emil
    -0.07
    -0.07
    idges
    -0.07
     genetics
    -0.07
     edib
    -0.07
    POSITIVE LOGITS
    ,因为
    0.12
     omdat
    0.10
     потому
    0.10
     क्योंकि
    0.09
     কারণ
    0.09
     kerana
    0.09
     เพราะ
    0.08
     retrospect
    0.08
     کیونکہ
    0.08
     correspondiente
    0.08
    Act Density 0.057%

    No Known Activations