INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     پر
    -0.08
     تن
    -0.07
    .Global
    -0.07
    这种
    -0.07
     winters
    -0.07
    这一
    -0.07
    .http
    -0.07
    Examples
    -0.07
     مت
    -0.07
     assessment
    -0.07
    POSITIVE LOGITS
     նա
    0.09
     դու
    0.09
     hevði
    0.09
     coeff
    0.09
     Bw
    0.09
    дардын
    0.09
    шись
    0.09
     Նա
    0.09
     ogr
    0.08
     locus
    0.08
    Act Density 0.072%

    No Known Activations