INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ለአ
    0.22
     तलाक
    0.22
    ד
    0.22
     komplet
    0.21
    0.21
    0.21
     समझाया
    0.21
     وغیرہ
    0.21
    דע
    0.20
     비해
    0.20
    POSITIVE LOGITS
    org
    0.26
    ont
    0.23
    ini
    0.23
    long
    0.23
    ani
    0.22
    one
    0.22
     his
    0.22
    ongo
    0.22
    current
    0.22
    idar
    0.21
    Act Density 0.257%

    No Known Activations