INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    /antlr
    -0.08
    Pues
    -0.08
    History
    -0.07
     주변
    -0.07
    Finalmente
    -0.07
     குறித்து
    -0.07
    EMU
    -0.07
     الثق
    -0.07
     הלא
    -0.07
    _even
    -0.07
    POSITIVE LOGITS
     ಮಕ್ಕ
    0.09
    ically
    0.09
    ически
    0.09
     taýdan
    0.08
     ಮಕ್ಕಳ
    0.08
     ketosis
    0.08
     speaking
    0.08
    ическую
    0.08
     crianças
    0.08
    ическими
    0.07
    Act Density 0.015%

    No Known Activations