INDEX
    Explanations

    independence

    New Auto-Interp
    Negative Logits
    _runtime
    -0.06
    يلم
    -0.06
     damned
    -0.06
    _SPE
    -0.06
     IOException
    -0.06
     عبدالله
    -0.06
    -0.06
     visitors
    -0.06
     flaming
    -0.06
     сох
    -0.06
    POSITIVE LOGITS
    	up
    0.07
    čin
    0.06
     Vog
    0.06
    名稱
    0.06
     सदस
    0.06
    EditMode
    0.06
    γωγ
    0.06
     слово
    0.06
     że
    0.06
    _instance
    0.06
    Act Density 0.025%

    No Known Activations