INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Ar
    -0.09
    Prote
    -0.08
    Ap
    -0.08
     structur
    -0.07
    Styl
    -0.07
    কর
    -0.07
    abstract
    -0.07
     inclined
    -0.07
     minute
    -0.07
     abstract
    -0.07
    POSITIVE LOGITS
     menuju
    0.08
     камп
    0.08
     CHP
    0.08
     کمپ
    0.08
     числа
    0.08
    -fast
    0.07
     sobald
    0.07
     دف
    0.07
     возраст
    0.07
     plazo
    0.07
    Act Density 0.002%

    No Known Activations