INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Peng
    -0.08
     سما
    -0.08
     coined
    -0.08
    ศัพท์
    -0.08
     brainstorming
    -0.08
    พิ
    -0.08
     Dharma
    -0.08
    اگر
    -0.08
     Hewlett
    -0.08
    langsung
    -0.08
    POSITIVE LOGITS
     жел
    0.08
    219
    0.08
    _CORE
    0.08
    001
    0.07
    22
    0.07
    242
    0.07
    jour
    0.07
    elif
    0.07
     peripheral
    0.07
    wb
    0.07
    Act Density 0.006%

    No Known Activations