INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     מג
    -0.08
    דה
    -0.08
    -0.08
     perform
    -0.08
     Wonder
    -0.08
     unreal
    -0.08
    -0.07
     wirken
    -0.07
    -0.07
    -0.07
    POSITIVE LOGITS
     Expr
    0.08
    0.08
     Nuggets
    0.08
     walnuts
    0.07
    orel
    0.07
    0.07
    0.07
    ರ್ಗ
    0.07
     fatty
    0.07
     bers
    0.07
    Act Density 0.003%

    No Known Activations