INDEX
    Explanations

    normal or ordinary concepts

    New Auto-Interp
    Negative Logits
     extremo
    0.42
    极其
    0.41
     অদ্ভুত
    0.39
     vantagem
    0.37
     deux
    0.36
     Expenditures
    0.36
     extrêmement
    0.36
     Très
    0.36
    0.35
     Tarifleri
    0.34
    POSITIVE LOGITS
    普通の
    1.47
    通常の
    1.36
     normal
    1.34
     일반
    1.30
     ordinary
    1.25
     обычной
    1.23
    普通的
    1.23
     normale
    1.22
     обы
    1.20
    普通
    1.20
    Act Density 0.707%

    No Known Activations