INDEX
    Explanations

    people and their actions/relations

    New Auto-Interp
    Negative Logits
     only
    0.36
    allele
    0.34
     hanya
    0.32
     sheer
    0.32
     exists
    0.31
    เป็น
    0.31
    forces
    0.31
    تبقى
    0.31
    zeuge
    0.30
    まさに
    0.30
    POSITIVE LOGITS
     الذين
    0.49
     którzy
    0.41
     cuyas
    0.37
     cuja
    0.37
     који
    0.36
     যাঁরা
    0.35
     пыта
    0.35
     ktorí
    0.34
     прио
    0.34
     cuya
    0.34
    Act Density 0.059%

    No Known Activations