INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    olves
    -0.07
    agas
    -0.06
     آنان
    -0.06
    .awt
    -0.06
    ­tion
    -0.06
     within
    -0.06
    inta
    -0.05
    、彼
    -0.05
    ((-
    -0.05
    ized
    -0.05
    POSITIVE LOGITS
     yöntem
    0.07
     EventArgs
    0.06
    .Program
    0.06
    dispatch
    0.06
     estimates
    0.06
    他的
    0.06
     grains
    0.06
    .Infrastructure
    0.06
    Movies
    0.06
    Friend
    0.06
    Act Density 0.025%

    No Known Activations