INDEX
    Explanations

    foreign characters or scripts

    New Auto-Interp
    Negative Logits
     ervoor
    0.89
     carcinomas
    0.88
     actualidad
    0.87
     anorexia
    0.85
    ʄ
    0.85
     luchar
    0.84
     apresentar
    0.83
     aguda
    0.82
     ойнотуу
    0.80
     よる
    0.80
    POSITIVE LOGITS
    re
    0.89
    Очень
    0.80
    ok
    0.79
    0.77
    اني
    0.76
    ש
    0.75
    دم
    0.75
    رض
    0.75
    Пи
    0.73
    ับ
    0.71
    Act Density 0.001%

    No Known Activations