INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    '
    1.78
    of
    1.40
    ם
    1.34
    1.16
    이었
    1.16
    ה
    1.12
    ка
    1.09
    ف
    1.09
    c
    1.08
    ες
    1.05
    POSITIVE LOGITS
     Cream
    1.18
    Cream
    1.14
     crema
    1.07
    ار
    1.03
    }$.
    1.03
     creme
    1.03
    的三
    1.02
    ائي
    1.01
    }$
    0.99
    的影响
    0.98
    Act Density 0.004%

    No Known Activations