INDEX
    Explanations

    certainty and assumptions

    New Auto-Interp
    Negative Logits
    iku
    -0.07
     Pale
    -0.07
     rot
    -0.07
    em
    -0.07
    Warp
    -0.07
     passage
    -0.07
    conn
    -0.07
     már
    -0.07
    helmet
    -0.07
     pale
    -0.07
    POSITIVE LOGITS
    。また
    0.11
    0.10
    。この
    0.09
    ,并
    0.09
    。ただ
    0.09
    ‌.
    0.09
    0.09
    ,然后
    0.09
     الأحيان
    0.08
    ,而且
    0.08
    Act Density 0.097%

    No Known Activations