INDEX
    Explanations

    possessives

    New Auto-Interp
    Negative Logits
     주변
    -0.09
    પણ
    -0.08
     운영
    -0.08
     Us
    -0.08
    acotta
    -0.08
    -width
    -0.08
     લોકોને
    -0.08
     limbs
    -0.08
    invalid
    -0.08
     фоне
    -0.08
    POSITIVE LOGITS
    关于
    0.09
     بشأن
    0.09
     చేసిన
    0.09
     excursions
    0.08
     conclusions
    0.08
     щодо
    0.08
    观点
    0.08
    方案
    0.08
     lös
    0.08
     केले
    0.08
    Act Density 0.097%

    No Known Activations