INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    АО
    -0.07
    .Domain
    -0.07
    .Get
    -0.07
    附加
    -0.07
    负担
    -0.07
    redni
    -0.07
     בסדר
    -0.06
    овое
    -0.06
    iciary
    -0.06
    Have
    -0.06
    POSITIVE LOGITS
    0.07
    ��
    0.07
    回购
    0.07
     Jeep
    0.06
    甚至连
    0.06
     Presbyterian
    0.06
     wolves
    0.06
    חשוב
    0.06
    0.06
    供暖
    0.06
    Act Density 0.017%

    No Known Activations