INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Zoo
    -0.07
    zenten
    -0.07
    Attrs
    -0.07
    RH
    -0.07
     zile
    -0.07
     défi
    -0.07
    TAG
    -0.07
     Jahrhund
    -0.07
     banning
    -0.07
    Twig
    -0.07
    POSITIVE LOGITS
    _yes
    0.11
     YES
    0.10
     yes
    0.09
     Yes
    0.09
     гасп
    0.09
    0.09
    Yes
    0.09
    yes
    0.09
     questionnaire
    0.09
     antwoorden
    0.09
    Act Density 0.016%

    No Known Activations