INDEX
    Explanations

    -ive suffix

    New Auto-Interp
    Negative Logits
    Elite
    -0.07
    ermen
    -0.07
    -0.07
     Regardless
    -0.07
    -0.07
     asbestos
    -0.07
    奇迹
    -0.07
    ЕН
    -0.07
    累了
    -0.07
    -0.07
    POSITIVE LOGITS
     деятель
    0.07
    Bs
    0.07
    مدر
    0.07
    保持着
    0.07
                            
    0.07
    0.07
    0.06
    入户
    0.06
    0.06
    عال
    0.06
    Act Density 0.015%

    No Known Activations