INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Other
    -0.08
     innych
    -0.08
     environs
    -0.08
     other's
    -0.08
     других
    -0.08
    (other
    -0.08
     entirety
    -0.08
     інших
    -0.08
     últ
    -0.08
    thus
    -0.08
    POSITIVE LOGITS
     استخدام
    0.12
     باستخدام
    0.11
    使用
    0.10
     استفاده
    0.10
     使用
    0.10
    Using
    0.10
     použit
    0.10
     using
    0.10
     használ
    0.09
     penggunaan
    0.09
    Act Density 0.011%

    No Known Activations