INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     используют
    -0.07
    Bes
    -0.07
     geçmiş
    -0.07
    比拟
    -0.07
    越し
    -0.07
     Isa
    -0.07
    יז
    -0.07
    מיד
    -0.07
    -0.07
    ohon
    -0.07
    POSITIVE LOGITS
     Wel
    0.08
     fichier
    0.07
     الطعام
    0.07
    朝阳
    0.07
     נוספת
    0.07
     stylish
    0.07
     Eb
    0.07
    .Ordinal
    0.07
    aktion
    0.07
     Artikel
    0.07
    Act Density 0.008%

    No Known Activations