INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     nejen
    0.36
    不仅
    0.35
    0.35
     อยู่
    0.35
    inoceros
    0.34
     אך
    0.34
     zarówno
    0.34
    不但
    0.32
     প্রথমেই
    0.32
    Analyzer
    0.31
    POSITIVE LOGITS
    一些
    0.51
     другие
    0.51
     некоторые
    0.48
     някои
    0.48
     অন্যান্য
    0.48
     einige
    0.48
     other
    0.47
    其他的
    0.47
     nogle
    0.46
     بعض
    0.46
    Act Density 0.298%

    No Known Activations