INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     equilibria
    0.84
     reassure
    0.67
     reassuring
    0.67
     gou
    0.66
     unassuming
    0.66
     summers
    0.65
     judicious
    0.65
     equilibration
    0.63
     nonchal
    0.63
     greeted
    0.62
    POSITIVE LOGITS
     впервые
    2.42
     erstmals
    2.02
     প্রথমবারের
    1.81
    初めて
    1.72
    首次
    1.67
     최초
    1.43
     पहली
    1.40
    第一次
    1.36
    for
    1.32
     unprecedented
    1.30
    Act Density 0.019%

    No Known Activations