INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     infected
    -0.07
    感染
    -0.07
    NOV
    -0.07
    Gram
    -0.07
     inflammation
    -0.07
    -0.07
    installer
    -0.07
    安卓
    -0.07
    herited
    -0.07
    ency
    -0.07
    POSITIVE LOGITS
    לב
    0.08
    بطال
    0.08
     меш
    0.08
    盘口
    0.08
     Ahmad
    0.08
     pupil
    0.08
    fan
    0.08
    0.08
     carers
    0.08
     Vase
    0.07
    Act Density 0.000%

    No Known Activations