INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -provoking
    -0.08
     spare
    -0.08
     Anthony
    -0.08
    -0.07
    Anthony
    -0.07
     textbook
    -0.07
     Barg
    -0.07
     ан
    -0.07
    -0.07
    -0.07
    POSITIVE LOGITS
     знакомств
    0.09
    crawler
    0.09
    ع
    0.09
    上的
    0.08
     Teg
    0.08
     الإلكتروني
    0.08
     www
    0.08
    OY
    0.08
     уч
    0.08
     سائ
    0.08
    Act Density 0.037%

    No Known Activations