INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _literals
    -0.07
     इस्तेमाल
    -0.07
     компет
    -0.07
    -follow
    -0.07
    -essential
    -0.07
    -uit
    -0.07
     erlaubt
    -0.07
     Atkins
    -0.07
    anez
    -0.07
     DAS
    -0.07
    POSITIVE LOGITS
    angered
    0.08
    50
    0.08
    omena
    0.08
    anki
    0.08
     similares
    0.08
     amort
    0.08
    placing
    0.08
     مسا
    0.08
    0.08
    омина
    0.07
    Act Density 0.050%

    No Known Activations