INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ROL
    -0.08
     zel
    -0.08
     Phot
    -0.07
     Overseas
    -0.07
     rand
    -0.07
     бел
    -0.07
     belts
    -0.07
    Phot
    -0.07
     الأبيض
    -0.07
     functionality
    -0.07
    POSITIVE LOGITS
     empathy
    0.14
     conversational
    0.13
     empat
    0.13
     الحوار
    0.13
     empath
    0.12
    'écoute
    0.12
    交流
    0.11
    0.11
     Gespräch
    0.11
     écouter
    0.11
    Act Density 0.028%

    No Known Activations