INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     magnet
    -0.10
    тически
    -0.09
    -FIRST
    -0.08
     точки
    -0.08
    ipple
    -0.08
    fach
    -0.07
    entious
    -0.07
     tears
    -0.07
    IHE
    -0.07
     teased
    -0.07
    POSITIVE LOGITS
     jw
    0.08
     Cocktail
    0.07
     Horizons
    0.07
     கால
    0.07
     sezon
    0.07
     Sociale
    0.07
     sab
    0.07
     Gerr
    0.07
     svom
    0.07
     Gab
    0.07
    Act Density 0.000%

    No Known Activations