INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ziv
    -0.09
     Zee
    -0.09
     žád
    -0.09
     yung
    -0.09
    ്യേ
    -0.08
     ileg
    -0.08
     ضع
    -0.08
     Kann
    -0.08
     Kasi
    -0.08
    -0.08
    POSITIVE LOGITS
    inerja
    0.17
    egiatan
    0.16
    umpulan
    0.15
    aryawan
    0.15
    eterangan
    0.15
    embangkan
    0.15
    unci
    0.14
    oneksi
    0.14
    ucing
    0.14
    emenangan
    0.14
    Act Density 0.002%

    No Known Activations