INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     seinem
    0.18
    asmuch
    0.18
    inoceros
    0.18
     dezelfde
    0.18
     бывшего
    0.18
     metaphys
    0.17
     prépuce
    0.17
     njegove
    0.16
     swojego
    0.16
     ennemis
    0.16
    POSITIVE LOGITS
    3
    0.26
    info
    0.24
    4
    0.24
    0.23
    0.23
     với
    0.21
    5
    0.21
    *,
    0.20
    with
    0.20
    data
    0.20
    Act Density 0.367%

    No Known Activations