INDEX
    Explanations

    intensifiers or qualifiers

    New Auto-Interp
    Negative Logits
    ΙΑ
    0.25
    だけでなく
    0.24
    ;
    0.24
     aka
    0.23
    0.23
     بسیاری
    0.23
    0.23
     завжди
    0.23
    HASH
    0.22
    まさに
    0.22
    POSITIVE LOGITS
     been
    0.29
     bruge
    0.27
     في
    0.27
     yra
    0.27
     את
    0.26
     لل
    0.26
     عن
    0.26
    的的
    0.26
     يكون
    0.25
     teie
    0.25
    Act Density 0.336%

    No Known Activations