INDEX
    Explanations

    references to user tips and advice

    New Auto-Interp
    Negative Logits
     Äįlov
    -0.31
     vÄĽn
    -0.27
     zástup
    -0.27
     Äįty
    -0.25
     chtÄĽ
    -0.25
     udál
    -0.24
     dÅĻÃŃ
    -0.20
    tÄĽl
    -0.18
     vzdálen
    -0.18
     zdrav
    -0.17
    POSITIVE LOGITS
     apl
    0.21
     soft
    0.21
     funk
    0.19
     aplik
    0.18
     dan
    0.18
     virt
    0.18
     inst
    0.17
     disple
    0.17
     synchron
    0.17
     implement
    0.17
    Act Density 0.005%

    No Known Activations