INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Rash
    -0.08
     القرآن
    -0.07
    shint
    -0.07
    -0.07
     CLASS
    -0.06
    ählt
    -0.06
    -0.06
    submenu
    -0.06
     Kasich
    -0.06
     кого
    -0.06
    POSITIVE LOGITS
    OCI
    0.07
    RO
    0.07
     stricter
    0.06
     fibr
    0.06
    +.
    0.06
    'e
    0.06
    ana
    0.06
    ?.
    0.06
    _valid
    0.06
    /frontend
    0.06
    Act Density 0.000%

    No Known Activations