INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    .students
    -0.07
    ,而
    -0.06
    inski
    -0.06
    byn
    -0.06
    .container
    -0.06
     yüzden
    -0.06
    ,要
    -0.06
    ello
    -0.06
    金融
    -0.06
     دانشجوی
    -0.06
    POSITIVE LOGITS
    leri
    0.07
    863
    0.07
    (face
    0.07
     yum
    0.06
     yr
    0.06
    actices
    0.06
    _pi
    0.06
     Kathy
    0.06
    Islam
    0.06
     تسم
    0.06
    Act Density 0.000%

    No Known Activations