INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -
    -0.82
     oysters
    -0.61
    ValueStyle
    -0.59
     leprosy
    -0.58
     sapp
    -0.58
    TagMode
    -0.57
    دانشنامهٔ
    -0.57
     astra
    -0.57
     Signor
    -0.57
     leech
    -0.57
    POSITIVE LOGITS
     énergé
    0.85
     détru
    0.81
     fermés
    0.81
     présentés
    0.75
     automatiques
    0.74
     complètes
    0.74
     supplémentaires
    0.73
     définiti
    0.73
     supérieurs
    0.73
     financières
    0.71
    Act Density 0.123%

    No Known Activations