INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     skin
    -0.07
    -0.07
     mise
    -0.07
    -0.07
    اعتماد
    -0.07
    thetic
    -0.07
    -0.06
     расположен
    -0.06
    侦查
    -0.06
    -0.06
    POSITIVE LOGITS
    (Attribute
    0.07
    決め
    0.07
     zdarma
    0.06
     Clim
    0.06
    0.06
    0.06
    0.06
    0.06
    流产
    0.06
    nym
    0.06
    Act Density 0.078%

    No Known Activations