INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    FormItem
    -0.08
    svg
    -0.08
    łem
    -0.07
    ってきた
    -0.06
     heeft
    -0.06
     yeşil
    -0.06
     quat
    -0.06
    _ten
    -0.06
     مدل
    -0.06
    kb
    -0.06
    POSITIVE LOGITS
     Time
    0.08
     time
    0.07
     times
    0.07
     TIME
    0.06
    .arch
    0.06
     Times
    0.06
    Times
    0.06
     adversely
    0.06
    Annotation
    0.06
    -region
    0.06
    Act Density 0.015%

    No Known Activations