INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     vidare
    -0.09
    -0.08
     fyl
    -0.07
     والمع
    -0.07
    ouveau
    -0.07
    لح
    -0.07
    .Transfer
    -0.07
    рин
    -0.07
    .calc
    -0.07
     scat
    -0.07
    POSITIVE LOGITS
    0.10
     subdued
    0.09
     제한
    0.09
     tame
    0.09
     moderation
    0.08
     límites
    0.08
     restraint
    0.08
     умер
    0.08
    限制
    0.08
    மான
    0.08
    Act Density 0.081%

    No Known Activations