INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     previs
    -0.08
    inct
    -0.07
    iniz
    -0.07
     мін
    -0.07
    િમ
    -0.07
    883
    -0.07
     prevail
    -0.07
    ichts
    -0.07
     eny
    -0.07
    ermi
    -0.07
    POSITIVE LOGITS
    .rd
    0.09
    זה
    0.08
    0.08
     ಇದು
    0.08
    0.08
    ="../../../
    0.08
     ಸ್ಥಾನ
    0.07
     Curious
    0.07
    .ul
    0.07
     aansluiten
    0.07
    Act Density 0.000%

    No Known Activations