INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     memulai
    0.48
    nobody
    0.48
     chcesz
    0.47
     nobody
    0.45
    ۔
    0.45
     niemand
    0.44
     člov
    0.43
     név
    0.42
     ordinairement
    0.42
     اجرا
    0.42
    POSITIVE LOGITS
     अन्य
    0.74
     других
    0.73
     অন্যান্য
    0.72
     також
    0.70
     additional
    0.68
    其他
    0.68
     также
    0.68
     અન્ય
    0.67
     ఇతర
    0.66
     tambahan
    0.64
    Act Density 0.618%

    No Known Activations