INDEX
    Explanations

    Names of characters/actors

    New Auto-Interp
    Negative Logits
    -0.08
    _INTERFACE
    -0.08
    不断提升
    -0.08
    .speed
    -0.07
    馒头
    -0.07
    个国家
    -0.07
    -0.07
    身后
    -0.07
     Kitt
    -0.07
    什么原因
    -0.07
    POSITIVE LOGITS
     нельзя
    0.07
     council
    0.07
    0.07
     Sous
    0.07
     בכתב
    0.07
    شا
    0.07
     Dy
    0.07
    0.06
     correo
    0.06
    _ue
    0.06
    Act Density 0.026%

    No Known Activations