INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    cn
    -0.09
     grau
    -0.08
    Mont
    -0.08
     umf
    -0.07
     revoke
    -0.07
     US
    -0.07
     Angeb
    -0.07
     honum
    -0.07
     sore
    -0.07
    moor
    -0.07
    POSITIVE LOGITS
     pedagog
    0.08
     допуска
    0.08
    ajj
    0.07
    0.07
     більш
    0.07
     педагог
    0.07
    Authorized
    0.07
     தெர
    0.07
     Authorized
    0.07
    adii
    0.07
    Act Density 0.007%

    No Known Activations