INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Bewer
    -0.08
    boo
    -0.07
    demo
    -0.07
     procrast
    -0.07
    something
    -0.07
     Puppy
    -0.07
    opo
    -0.07
     баб
    -0.07
     prova
    -0.07
    kop
    -0.07
    POSITIVE LOGITS
     stringent
    0.08
     sel
    0.08
    Correction
    0.07
    Accounting
    0.07
     inso
    0.07
    0.07
     verkeer
    0.07
     zure
    0.07
     vorgenommen
    0.07
    ியான
    0.07
    Act Density 0.003%

    No Known Activations