INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     papill
    -0.08
     plantation
    -0.08
     Tires
    -0.08
    HL
    -0.08
     tyre
    -0.08
    Trap
    -0.08
    KW
    -0.07
    -0.07
    Bride
    -0.07
     captiv
    -0.07
    POSITIVE LOGITS
     در
    0.08
    0.08
     prest
    0.08
    aged
    0.08
     المستخدم
    0.08
     tek
    0.07
     pays
    0.07
     Про
    0.07
     kerja
    0.07
     Potter
    0.07
    Act Density 0.015%

    No Known Activations