INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     "#
    -0.08
    -0.07
    OV
    -0.07
     Locked
    -0.07
     tục
    -0.07
    -0.07
     '#
    -0.07
     مقابل
    -0.06
    *T
    -0.06
    ABI
    -0.06
    POSITIVE LOGITS
    0.08
    0.07
    0.07
    0.07
     intestinal
    0.07
     מהמע
    0.07
    0.07
     الرو
    0.07
     vários
    0.07
    0.07
    Act Density 0.006%

    No Known Activations