INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     masa
    -0.09
     disclaim
    -0.08
     Angola
    -0.08
     grav
    -0.07
    athe
    -0.07
     Grav
    -0.07
    ading
    -0.07
     ERA
    -0.07
    oja
    -0.07
    .wx
    -0.07
    POSITIVE LOGITS
     überw
    0.08
    stücke
    0.08
     ആണ്
    0.07
     äußerst
    0.07
     complications
    0.07
     zeit
    0.07
     ознаком
    0.07
     (>
    0.07
     खू
    0.07
    0.07
    Act Density 0.022%

    No Known Activations