INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     kuk
    -0.07
    -0.06
    eview
    -0.06
     tub
    -0.06
     Ül
    -0.06
     pitch
    -0.06
     زیب
    -0.06
    inition
    -0.06
     LOT
    -0.06
     minority
    -0.06
    POSITIVE LOGITS
     sẵn
    0.06
    anax
    0.06
    .watch
    0.06
     Almanya
    0.06
    选�
    0.06
     دستی
    0.06
    نامه
    0.06
    农业
    0.06
    Guest
    0.06
     bevor
    0.06
    Act Density 0.000%

    No Known Activations