INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     zelf
    -0.08
     onth
    -0.08
    orse
    -0.08
     deficits
    -0.08
    -0.08
     selbst
    -0.07
     vows
    -0.07
     Bram
    -0.07
    (el
    -0.07
     Prov
    -0.07
    POSITIVE LOGITS
     प्रदेश
    0.10
    地区
    0.10
    カテゴリー
    0.10
    カテゴリ
    0.09
     ప్రాంత
    0.09
     wilayah
    0.09
     অঞ্চল
    0.09
     그룹
    0.09
     Americas
    0.09
     реги
    0.09
    Act Density 0.026%

    No Known Activations