INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    s
    -0.92
    a
    -0.79
    ی
    -0.77
    ه
    -0.77
    e
    -0.75
    i
    -0.71
    o
    -0.68
    -0.65
    y
    -0.63
    ième
    -0.60
    POSITIVE LOGITS
     ligiloj
    0.51
    دانشنامهٔ
    0.50
    ings
    0.50
     ischemia
    0.48
    haviours
    0.48
    ary
    0.47
     Tampoco
    0.47
    ubat
    0.47
    おり
    0.46
     ringing
    0.45
    Act Density 0.053%

    No Known Activations