INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     مدير
    -0.08
    ษายน
    -0.07
     Ne
    -0.07
    -0.06
     pulver
    -0.06
     Virus
    -0.06
    Hyper
    -0.06
    ibir
    -0.06
     people
    -0.06
     Gener
    -0.06
    POSITIVE LOGITS
     slot
    0.09
    Slot
    0.09
     Slot
    0.08
    Slots
    0.08
    [slot
    0.08
     SLOT
    0.08
    ltr
    0.07
    	slot
    0.07
    slot
    0.07
    ोज
    0.07
    Act Density 0.003%

    No Known Activations