INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     lag
    -0.08
     gera
    -0.08
     fik
    -0.08
     Cd
    -0.07
     Aug
    -0.07
     kapa
    -0.07
     potem
    -0.07
    เหตุ
    -0.07
     uro
    -0.07
     scap
    -0.07
    POSITIVE LOGITS
    0.09
    greater
    0.08
    .drag
    0.08
    0.08
    photo
    0.07
    0.07
    ίων
    0.07
     পাও
    0.07
    nm
    0.07
    .pe
    0.07
    Act Density 0.002%

    No Known Activations