INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Announcement
    -0.07
    طبق
    -0.07
    Trader
    -0.07
    وفر
    -0.07
    (tableView
    -0.07
     Figures
    -0.07
    學院
    -0.07
    تصرف
    -0.07
     Auf
    -0.07
     %[
    -0.07
    POSITIVE LOGITS
    ancias
    0.08
    0.08
     contin
    0.07
    0.07
    0.07
    Dest
    0.07
     contrario
    0.07
    0.07
    让他们
    0.07
    "But
    0.07
    Act Density 0.001%

    No Known Activations