INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     spoken
    -0.07
    ol
    -0.07
     Armen
    -0.07
    651
    -0.07
    807
    -0.06
    005
    -0.06
    )]);↵
    -0.06
     posture
    -0.06
     Método
    -0.06
     tweeting
    -0.06
    POSITIVE LOGITS
     factory
    0.12
     Factory
    0.09
    Factory
    0.09
    fresh
    0.07
    aji
    0.07
     factories
    0.07
     کارخانه
    0.07
    FORCE
    0.07
    ازی
    0.07
     صنعت
    0.07
    Act Density 0.006%

    No Known Activations