INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    定居
    -0.07
     מגיב
    -0.07
    -0.07
     mogą
    -0.06
    閱讀
    -0.06
     dostępny
    -0.06
    -0.06
     receptive
    -0.06
    -0.06
     Bucc
    -0.06
    POSITIVE LOGITS
    fer
    0.08
     firewall
    0.07
     subroutine
    0.07
    swer
    0.07
    INVALID
    0.07
     Quad
    0.07
    assin
    0.07
    fig
    0.07
    HAM
    0.06
    Invest
    0.06
    Act Density 0.001%

    No Known Activations