INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ΑΙ
    -0.08
     pornstar
    -0.08
     pornos
    -0.08
     Pew
    -0.08
    านคร
    -0.08
    αι
    -0.08
     PPS
    -0.08
    '){
    ↵
    -0.07
    ись
    -0.07
     pursuit
    -0.07
    POSITIVE LOGITS
     Дан
    0.08
     Да
    0.08
     Cic
    0.07
     Diagram
    0.07
     ha
    0.07
     evaluar
    0.07
    =h
    0.07
     datos
    0.07
     dei
    0.07
     electrónico
    0.07
    Act Density 0.007%

    No Known Activations