INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     pesticides
    -0.08
    -able
    -0.07
     Grind
    -0.07
     endogenous
    -0.07
    -minded
    -0.07
     Kol
    -0.07
     minded
    -0.07
    [X
    -0.07
    মূল
    -0.07
     Christoph
    -0.07
    POSITIVE LOGITS
    wać
    0.09
    اء
    0.08
     вс
    0.07
     đôi
    0.07
     pitää
    0.07
     ON
    0.07
     สู
    0.07
     مقاب
    0.07
    dots
    0.07
    ľad
    0.07
    Act Density 0.006%

    No Known Activations