INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    냈다
    0.99
    졌다
    0.91
     밝혔다
    0.86
     말했다
    0.79
     때문이다
    0.79
     됐다
    0.74
     하였다
    0.74
    の通販
    0.74
    하였다
    0.72
     것이다
    0.71
    POSITIVE LOGITS
    ;
    3.99
    ؛
    3.38
    3.31
     ;
    3.10
     ؛
    2.87
    2.80
    ;//
    2.66
    .;
    2.62
    *;
    2.59
    $;
    2.57
    Act Density 2.592%

    No Known Activations