INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Fisheries
    -0.08
    ിനെ
    -0.08
     posuere
    -0.08
     Hert
    -0.07
     desl
    -0.07
     Definition
    -0.07
     diesem
    -0.07
     este
    -0.07
     tento
    -0.07
     Bye
    -0.07
    POSITIVE LOGITS
     eléct
    0.08
    aku
    0.08
    /change
    0.07
     Kami
    0.07
    ↵  ↵
    0.07
    _ALLOWED
    0.07
    Allowed
    0.07
    0.07
    [np
    0.07
    **)
    0.07
    Act Density 0.009%

    No Known Activations