INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    43
    -0.07
     civilization
    -0.07
    kn
    -0.07
    Kn
    -0.07
     mankind
    -0.07
    .Con
    -0.07
    (pi
    -0.07
    texts
    -0.06
    Sun
    -0.06
    (temp
    -0.06
    POSITIVE LOGITS
     berlangsung
    0.10
     backdrop
    0.09
    ує
    0.09
     uncle
    0.08
     إسرائيل
    0.08
     troupe
    0.08
     arrivée
    0.08
    ไหม
    0.08
     israel
    0.08
    -nav
    0.08
    Act Density 0.001%

    No Known Activations