INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Вікіпе
    -0.61
     الرياضيه
    -0.56
    prefixer
    -0.55
    Geplaatst
    -0.55
    oluble
    -0.54
     חיצוניים
    -0.54
     piena
    -0.53
    aarrggbb
    -0.53
    )__
    -0.53
    Portail
    -0.52
    POSITIVE LOGITS
    InjectAttribute
    0.59
    cshtml
    0.56
    WebElementEntity
    0.52
    awtextra
    0.49
     Réponses
    0.48
     Schwe
    0.47
    ogu
    0.45
    jublj
    0.45
     autorytatywna
    0.44
     materna
    0.43
    Act Density 0.004%

    No Known Activations