INDEX
    Explanations

    how things are produced and presented

    New Auto-Interp
    Negative Logits
     ένας
    0.41
     आंकड़ा
    0.40
     occhi
    0.39
     нескольких
    0.39
     Gefühl
    0.38
    𝙰
    0.38
     actualización
    0.37
    一些
    0.37
     подходит
    0.37
    මත්
    0.37
    POSITIVE LOGITS
     during
    0.49
    ในการ
    0.48
     on
    0.46
     in
    0.46
    ใน
    0.45
     within
    0.43
    ByUser
    0.42
    ระหว่าง
    0.42
     trong
    0.41
     podczas
    0.41
    Act Density 0.190%

    No Known Activations