INDEX
    Explanations

    namely, that is, called

    New Auto-Interp
    Negative Logits
     сколько
    0.40
    だけでも
    0.39
     cometido
    0.38
     koliko
    0.38
    多少
    0.37
    的一些
    0.37
    那么多
    0.36
    0.36
     categorization
    0.35
    oty
    0.35
    POSITIVE LOGITS
    那就是
    0.93
     namely
    0.89
     yaitu
    0.84
    namely
    0.82
    就是
    0.76
    คือ
    0.76
     Namely
    0.68
    可以是
    0.68
     คือ
    0.68
     就是
    0.66
    Act Density 0.038%

    No Known Activations