INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ตอบ
    -0.07
    jące
    -0.07
    umping
    -0.07
    该项
    -0.07
     הראשון
    -0.07
    declaration
    -0.07
    此举
    -0.07
    -demand
    -0.07
    行业发展
    -0.07
     nors
    -0.07
    POSITIVE LOGITS
    0.08
     своб
    0.07
    0.07
    ialect
    0.07
    .original
    0.07
    0.07
     Orth
    0.07
    ExecutionContext
    0.07
    0.07
    宴会
    0.07
    Act Density 0.006%

    No Known Activations