INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    каж
    -0.08
    -0.08
    बस
    -0.08
    当然
    -0.07
     necessity
    -0.07
    kega
    -0.07
    -0.07
    opak
    -0.07
     divina
    -0.07
    -0.07
    POSITIVE LOGITS
     gloom
    0.09
    eyond
    0.08
    ície
    0.08
    ícies
    0.08
     fondos
    0.08
     adicional
    0.08
    ाजन
    0.08
     cực
    0.08
     Nih
    0.07
    .additional
    0.07
    Act Density 0.035%

    No Known Activations