INDEX
    Explanations
    No Explanations Found
    New Auto-Interp
    Negative Logits
     저희
    1.20
    如果您
    1.17
    되었습니다
    1.16
     저는
    1.12
     같습니다
    1.12
    였습니다
    1.12
    했습니다
    1.10
    입니다
    1.09
     않습니다
    1.07
    하였습니다
    1.07
    POSITIVE LOGITS
     тебя
    2.55
     тебе
    2.53
     ты
    2.38
     тво
    2.36
     তুমি
    2.25
     тобой
    2.20
     тобі
    2.20
     puedes
    2.19
     thou
    2.17
     tienes
    2.17
    Act Density 0.316%

    No Known Activations