INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     año
    -0.08
    ənd
    -0.07
     intertwined
    -0.07
     stor
    -0.07
     inm
    -0.07
     colo
    -0.07
     inne
    -0.07
     després
    -0.07
    zina
    -0.07
    y
    -0.07
    POSITIVE LOGITS
     അപേക്ഷ
    0.08
    Manchester
    0.08
     আবেদন
    0.08
     мона
    0.08
    ிற்கு
    0.08
    .ap
    0.08
    Franc
    0.08
    ৈতিক
    0.08
     BAN
    0.08
    Thomas
    0.08
    Act Density 0.045%

    No Known Activations