INDEX
    Explanations

    именно

    New Auto-Interp
    Negative Logits
     ze
    -0.09
    elerin
    -0.08
     вполне
    -0.08
    ీయ
    -0.08
    ింప
    -0.08
    -0.07
     vestibulum
    -0.07
    ించారు
    -0.07
    ించిన
    -0.07
    iler
    -0.07
    POSITIVE LOGITS
    Scrolling
    0.08
    时候
    0.08
    Thu
    0.07
    นี้
    0.07
     دل
    0.07
    ikke
    0.07
     BI
    0.07
     Δ
    0.07
    'n
    0.07
     lining
    0.07
    Act Density 0.007%

    No Known Activations