INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    主管
    -0.09
     Forg
    -0.08
    mmat
    -0.08
     Toby
    -0.07
     белән
    -0.07
     homolog
    -0.07
     ilə
    -0.07
    Reached
    -0.07
    ho
    -0.07
    ologist
    -0.07
    POSITIVE LOGITS
    aneamente
    0.09
    కుండా
    0.09
     פעם
    0.08
     tegelijk
    0.08
     আগে
    0.08
     tegelijkertijd
    0.08
     simult
    0.08
    'avance
    0.08
     동시에
    0.08
     rn
    0.08
    Act Density 0.011%

    No Known Activations