INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     منظر
    -0.08
    стве
    -0.07
     oldal
    -0.07
    iving
    -0.07
    abeled
    -0.07
     eure
    -0.07
    -ranked
    -0.07
     konkrete
    -0.07
    TING
    -0.07
    -0.07
    POSITIVE LOGITS
     regarding
    0.10
     Regarding
    0.10
     dotycz
    0.10
     privind
    0.10
    事项
    0.09
     dotyczą
    0.09
     לגבי
    0.09
    指出
    0.09
     درباره
    0.09
     关于
    0.09
    Act Density 0.015%

    No Known Activations