INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     किसी
    1.30
     सभी
    1.19
     Если
    1.12
     только
    1.07
     अपने
    1.04
    Аль
    1.04
     पहले
    1.03
     распростра
    1.02
     США
    1.01
     उन्हें
    1.00
    POSITIVE LOGITS
     poate
    1.18
     în
    1.09
     være
    1.06
    1.01
    În
    1.00
     възможно
    0.99
     pentru
    0.94
     În
    0.93
     какво
    0.91
    ând
    0.91
    Act Density 0.004%

    No Known Activations