INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    мышл
    -0.07
    تق
    -0.07
    -0.07
     DPI
    -0.07
    ALLE
    -0.06
     подготовк
    -0.06
    plier
    -0.06
     tit
    -0.06
    村党支部
    -0.06
     Bo
    -0.06
    POSITIVE LOGITS
    roke
    0.07
    search
    0.07
    _unused
    0.07
    -default
    0.07
    开学
    0.07
    asures
    0.07
     Amnesty
    0.06
    世界杯
    0.06
    社会
    0.06
     lorem
    0.06
    Act Density 0.000%

    No Known Activations