INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     الشباب
    -0.07
    -0.07
    -0.07
    -0.07
     objeto
    -0.06
     peque
    -0.06
    -0.06
     criança
    -0.06
     الطلاب
    -0.06
     enfermed
    -0.06
    POSITIVE LOGITS
     globals
    0.08
     mot
    0.08
    _SPI
    0.07
     morality
    0.07
     Datagram
    0.07
     moral
    0.07
     LM
    0.07
     mijn
    0.07
    三分
    0.07
    MOV
    0.07
    Act Density 0.000%

    No Known Activations