INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Kill
    -0.08
    ========↵
    -0.07
    高压
    -0.07
     trays
    -0.07
    atted
    -0.07
     you
    -0.07
    压实
    -0.07
     deck
    -0.07
    ウン
    -0.07
    -0.07
    POSITIVE LOGITS
     الانتخابات
    0.07
    בחירה
    0.07
     الانتخاب
    0.07
    排序
    0.07
    0.07
    0.07
     belang
    0.07
     
    0.07
    0.06
     espera
    0.06
    Act Density 0.061%

    No Known Activations