INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -_
    -0.06
     BT
    -0.06
     Hezbollah
    -0.06
     Tage
    -0.06
     styl
    -0.06
     fi
    -0.06
     monot
    -0.06
    apeutics
    -0.06
     Độ
    -0.06
     біль
    -0.06
    POSITIVE LOGITS
    dür
    0.07
    γκ
    0.07
    ptions
    0.07
    ContentView
    0.07
    ΑΝ
    0.07
    सन
    0.07
    Κ
    0.07
     acesso
    0.07
    crypt
    0.07
     textStatus
    0.06
    Act Density 0.217%

    No Known Activations