INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    更多的是
    -0.08
    幫助
    -0.08
    有足够的
    -0.07
    多くの
    -0.07
    -w
    -0.07
     Bew
    -0.07
    Cd
    -0.07
    .where
    -0.07
     Bren
    -0.06
     nisi
    -0.06
    POSITIVE LOGITS
     eventdata
    0.07
    PropertyValue
    0.07
    פוט
    0.07
    פעיל
    0.06
    ABS
    0.06
    プラ
    0.06
     Projectile
    0.06
     FOUR
    0.06
     forum
    0.06
    广电
    0.06
    Act Density 0.004%

    No Known Activations