INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -Oct
    -0.07
    igde
    -0.07
     আব
    -0.07
    pets
    -0.07
    calls
    -0.07
     Sabbath
    -0.07
     অথবা
    -0.07
    ১০
    -0.07
     পথে
    -0.07
    Certified
    -0.07
    POSITIVE LOGITS
     kuu
    0.08
     NONE
    0.08
     każdego
    0.08
     ника
    0.08
    0.07
     없음
    0.07
    0.07
     kamera
    0.07
     cuk
    0.07
     bille
    0.07
    Act Density 0.785%

    No Known Activations