INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ҳу
    0.58
     denominada
    0.57
     తెలిపారు
    0.54
     характеристи
    0.52
     organizaciones
    0.52
     individuales
    0.52
    iculares
    0.52
    व्यक्तित्व
    0.52
    izacin
    0.51
     домаћинствима
    0.50
    POSITIVE LOGITS
     ça
    1.51
     vraiment
    1.13
     Ça
    1.09
     maintenant
    1.07
     même
    1.05
     avec
    1.04
    ça
    1.04
     quand
    1.03
     aussi
    1.02
     quoi
    1.02
    Act Density 0.028%

    No Known Activations