INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    اتی
    -0.08
    ाप
    -0.07
     contrat
    -0.07
    asant
    -0.07
     descend
    -0.07
     गण
    -0.07
    -0.07
    ਪਰ
    -0.07
    لغ
    -0.07
    itas
    -0.07
    POSITIVE LOGITS
    大胆
    0.09
    zwa
    0.09
    🏻
    0.08
    🏼
    0.08
     gritty
    0.08
     prosecution
    0.08
    0.08
    baren
    0.07
    ändige
    0.07
    autos
    0.07
    Act Density 0.006%

    No Known Activations