INDEX
    Explanations

    words ending in "ing"

    New Auto-Interp
    Negative Logits
    ølge
    -0.09
    Preg
    -0.08
    Well
    -0.08
    Lake
    -0.08
     gebruikte
    -0.08
    greg
    -0.07
    Mil
    -0.07
    лыгы
    -0.07
    Lng
    -0.07
    рыл
    -0.07
    POSITIVE LOGITS
     aucun
    0.09
    ாமல்
    0.09
    ാതെ
    0.09
     ningún
    0.08
     risking
    0.08
     aucune
    0.08
     undue
    0.08
     fuss
    0.08
    0.08
     compromising
    0.08
    Act Density 0.089%

    No Known Activations