INDEX
    Explanations

    punctuation

    New Auto-Interp
    Negative Logits
    Israel
    -0.07
    油脂
    -0.07
     Mg
    -0.07
     Angus
    -0.07
    law
    -0.07
    -0.07
    Researchers
    -0.07
     coupe
    -0.07
     C
    -0.07
    تصميم
    -0.06
    POSITIVE LOGITS
    zet
    0.07
    -platform
    0.07
    ellij
    0.07
    afka
    0.07
     shel
    0.07
    (fil
    0.07
    oly
    0.07
    sha
    0.07
    *self
    0.06
    Down
    0.06
    Act Density 0.039%

    No Known Activations