INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ),'
    -0.07
     servis
    -0.06
    .Frame
    -0.06
     Tank
    -0.06
    ayer
    -0.06
     ділян
    -0.06
    ัฐบาล
    -0.06
    217
    -0.06
     WTO
    -0.06
    國家
    -0.06
    POSITIVE LOGITS
     madde
    0.06
     systemFontOfSize
    0.06
     File
    0.06
     plusieurs
    0.06
     خور
    0.06
    ź
    0.06
    0.06
     consulted
    0.06
     absent
    0.06
     vibrating
    0.06
    Act Density 0.014%

    No Known Activations