INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     تعامل
    -0.08
     عملیات
    -0.08
    يث
    -0.08
     डर
    -0.08
     aann
    -0.08
    -DD
    -0.08
     zorgen
    -0.07
     이해
    -0.07
    -design
    -0.07
    -0.07
    POSITIVE LOGITS
     cy
    0.08
    CEPT
    0.08
    KG
    0.08
    GRAY
    0.08
    gul
    0.08
     worker
    0.08
     youth
    0.08
     gaze
    0.07
     Majesty
    0.07
    _MAJOR
    0.07
    Act Density 0.002%

    No Known Activations