INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    vote
    -0.07
    Bar
    -0.07
    -0.06
     abrasive
    -0.06
     şart
    -0.06
    -0.06
    -0.06
    rip
    -0.06
    -0.06
     ret
    -0.06
    POSITIVE LOGITS
     itk
    0.08
    idf
    0.07
    uania
    0.07
    孵化器
    0.07
    impan
    0.07
    ,—
    0.07
    0.06
    得住
    0.06
     Austrian
    0.06
    يكا
    0.06
    Act Density 0.006%

    No Known Activations