INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ellt
    -0.07
    -0.06
    פלסטיני
    -0.06
     Nature
    -0.06
    (Menu
    -0.06
    -0.06
    seite
    -0.06
     ppt
    -0.06
    -0.06
    _DATA
    -0.06
    POSITIVE LOGITS
    oom
    0.08
     Chill
    0.08
    Gary
    0.07
    0.07
    热闹
    0.07
    Mc
    0.07
    0.07
     Mitar
    0.07
     своих
    0.07
    เถ
    0.07
    Act Density 0.005%

    No Known Activations