INDEX
    Explanations

    Polish grammar and common words

    New Auto-Interp
    Negative Logits
    ینګ
    1.83
     ی
    1.66
    ارهای
    1.57
     vague
    1.57
    ریب
    1.57
     Salesforce
    1.52
    عنی
    1.50
     पूर्व
    1.50
    ری
    1.48
    زمین
    1.45
    POSITIVE LOGITS
     może
    2.01
     już
    1.97
     więks
    1.92
     również
    1.89
     jeszcze
    1.85
     tylko
    1.83
     bardzo
    1.81
     róż
    1.81
     można
    1.80
     przy
    1.79
    Act Density 0.029%

    No Known Activations