INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    HIB
    -0.09
    בית
    -0.09
     Nichols
    -0.09
     reen
    -0.08
    _insert
    -0.08
    NSIndex
    -0.08
     média
    -0.08
    Belg
    -0.08
    ега
    -0.08
     hưởng
    -0.08
    POSITIVE LOGITS
     sekal
    0.08
    CCCC
    0.07
    先生
    0.07
    Oh
    0.07
    ken
    0.07
    0.07
     vole
    0.07
     handled
    0.07
     hul
    0.07
     cc
    0.07
    Act Density 0.000%

    No Known Activations