INDEX
    Explanations

    numbers and calculations

    New Auto-Interp
    Negative Logits
     dad
    -0.09
    dad
    -0.09
     ফলে
    -0.08
     netto
    -0.07
    Dad
    -0.07
     Heritage
    -0.07
     sobe
    -0.07
     verhe
    -0.07
     Sout
    -0.07
     associate
    -0.07
    POSITIVE LOGITS
     વગેરે
    0.10
     എന്നീ
    0.10
     ஆகிய
    0.10
     그리고
    0.10
     എന്നിവ
    0.09
     וכו
    0.09
    ,以及
    0.08
    以及
    0.08
     आदि
    0.08
    そして
    0.08
    Act Density 0.092%

    No Known Activations