INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ਕੰ
    -0.08
     acredit
    -0.08
    -0.08
     collo
    -0.08
     पुर
    -0.07
     सुर
    -0.07
     काम
    -0.07
    яр
    -0.07
     ram
    -0.07
     ún
    -0.06
    POSITIVE LOGITS
    jeni
    0.08
     Poe
    0.08
    மை
    0.08
     Cos
    0.08
    0.08
     لين
    0.08
    기를
    0.08
    0.07
     Haf
    0.07
    मे
    0.07
    Act Density 0.010%

    No Known Activations