INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    F
    -3.03
    ↵↵
    -2.77
    "
    -2.73
    (
    -2.69
    C
    -2.61
    H
    -2.58
    D
    -2.48
    W
    -2.41
    N
    -2.38
     aument
    -2.33
    POSITIVE LOGITS
     рішення
    2.61
    ésil
    2.50
    是個
    2.47
     якого
    2.42
     gustado
    2.38
    Хьажоргаш
    2.33
    änemark
    2.31
     wth
    2.25
     étab
    2.23
     définiti
    2.22
    Act Density 0.007%

    No Known Activations