INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ställ
    -0.10
    出台
    -0.08
    erseits
    -0.08
    сәт
    -0.08
    ;TZID
    -0.08
     Taf
    -0.08
     спас
    -0.08
     લીધ
    -0.08
    ọrụ
    -0.08
     Oleh
    -0.08
    POSITIVE LOGITS
     skinny
    0.10
     धी
    0.09
     तेज
    0.09
     picky
    0.09
     جدًا
    0.09
    _speed
    0.09
     cool
    0.09
    困难
    0.09
     ziemlich
    0.09
    容易
    0.09
    Act Density 0.158%

    No Known Activations