INDEX
    Explanations

    listing items ending in ism or concepts

    New Auto-Interp
    Negative Logits
    是因為
    0.47
     마찬가지
    0.41
    有两种
    0.40
    是因为
    0.40
    ですし
    0.39
    และความ
    0.37
    后续
    0.36
    !!!!
    0.36
    这一点
    0.36
    其他人
    0.36
    POSITIVE LOGITS
     ஆகியவற்ற
    1.29
     എന്നിവ
    1.27
     ஆகிய
    1.19
     ஆகியவை
    1.13
     ஆகியோர்
    1.07
    といった
    1.01
    など
    1.00
    などが
    0.99
    等等
    0.96
    などを
    0.93
    Act Density 0.203%

    No Known Activations