INDEX
    Explanations

    mathematics

    New Auto-Interp
    Negative Logits
    shirt
    -0.08
    بدو
    -0.08
    House
    -0.07
     calma
    -0.07
    �్
    -0.07
    -0.07
    face
    -0.07
    طالب
    -0.07
    -0.07
    شير
    -0.07
    POSITIVE LOGITS
    ingi
    0.08
     ей
    0.08
    UDP
    0.07
    0.07
    Н
    0.07
     Stadt
    0.07
    0.07
     воду
    0.07
    0.07
    番号
    0.07
    Act Density 0.086%

    No Known Activations