INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ngân
    -0.07
     Task
    -0.07
     Razor
    -0.07
    _ant
    -0.07
    地方政府
    -0.07
    案件
    -0.07
    onor
    -0.07
     Jub
    -0.07
    -0.07
    נושא
    -0.07
    POSITIVE LOGITS
    Attendance
    0.07
    .estado
    0.07
    :%
    0.07
     ****
    0.07
     Minuten
    0.06
     Cary
    0.06
     Essentials
    0.06
    月薪
    0.06
    REDIT
    0.06
    French
    0.06
    Act Density 0.002%

    No Known Activations