INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    agas
    -0.06
    _AL
    -0.06
    elters
    -0.06
    287
    -0.06
     bending
    -0.06
    ιος
    -0.06
     pie
    -0.06
     plague
    -0.06
     Samar
    -0.06
    codigo
    -0.06
    POSITIVE LOGITS
    	freopen
    0.07
     Short
    0.07
     PAR
    0.06
     κυ
    0.06
     pohled
    0.06
     Tales
    0.06
     explicit
    0.06
     При
    0.06
     sunt
    0.06
    -vous
    0.06
    Act Density 0.020%

    No Known Activations