INDEX
    Explanations

    weight, burden

    New Auto-Interp
    Negative Logits
     kh
    -0.08
     supérieure
    -0.08
    otechn
    -0.08
     ".↵↵
    -0.07
     joue
    -0.07
    undef
    -0.07
    ++,
    -0.07
     ";↵
    -0.07
    jev
    -0.07
     occ
    -0.07
    POSITIVE LOGITS
    ARING
    0.10
     katawan
    0.09
    asarkan
    0.09
     تريد
    0.09
    Drops
    0.09
     Agro
    0.09
     أجهزة
    0.09
    ложения
    0.08
    Fonte
    0.08
     molest
    0.08
    Act Density 0.001%

    No Known Activations