INDEX
    Explanations

    own governing documents

    New Auto-Interp
    Negative Logits
    因此
    0.44
    0.43
    total
    0.43
    lardır
    0.42
    ศัพท์
    0.41
     العملية
    0.41
    ש
    0.41
    Consequently
    0.41
    ش
    0.40
    รางวัล
    0.40
    POSITIVE LOGITS
     Defense
    0.56
     gamma
    0.52
     respectable
    0.51
     subordinate
    0.51
     Quincy
    0.50
     Ryu
    0.50
     tripped
    0.50
     Proud
    0.49
     elected
    0.49
     Gamma
    0.49
    Act Density 0.003%

    No Known Activations