INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     củ
    -0.07
    -0.07
    оне
    -0.07
     privileges
    -0.06
    สภ
    -0.06
     Bears
    -0.06
    ени
    -0.06
    _bitmap
    -0.06
     Clearance
    -0.06
    '$
    -0.06
    POSITIVE LOGITS
    http
    0.08
     ویکی
    0.06
     رقم
    0.06
     Naruto
    0.06
    0.06
     "@"
    0.06
     για
    0.06
    krit
    0.06
     http
    0.06
     trh
    0.06
    Act Density 0.002%

    No Known Activations