INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    üny
    -0.07
     karşı
    -0.07
    -0.06
    刚才
    -0.06
    .Tile
    -0.06
    ycled
    -0.06
    �t
    -0.06
    $select
    -0.06
     mCurrent
    -0.06
     út
    -0.06
    POSITIVE LOGITS
    КТ
    0.07
     peso
    0.07
    jeta
    0.07
    candidate
    0.07
    стати
    0.06
     آزمایش
    0.06
     رابط
    0.06
     رود
    0.06
    emean
    0.06
     splitter
    0.06
    Act Density 0.000%

    No Known Activations