INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    נד
    -0.08
     ingredients
    -0.07
    技术水平
    -0.07
    BV
    -0.07
     Rahmen
    -0.07
    بد
    -0.06
    Otherwise
    -0.06
    Expansion
    -0.06
     Characteristics
    -0.06
     הסו
    -0.06
    POSITIVE LOGITS
     toaster
    0.08
    \Factory
    0.07
     massac
    0.07
     phones
    0.07
    ;">
    ↵
    0.07
    ится
    0.07
    母公司
    0.06
    实体
    0.06
    ];
    ↵
    0.06
     bags
    0.06
    Act Density 0.000%

    No Known Activations