INDEX
    Explanations

    special phrases indicating an introduction or lead-in to a new topic

    New Auto-Interp
    Negative Logits
    pośred
    -0.74
    存于互联网档案馆
    -0.73
     Sante
    -0.72
    ValueStyle
    -0.71
     Lyt
    -0.67
    ̯
    -0.65
    GARET
    -0.64
    Bbb
    -0.64
    ススメ
    -0.64
    mitsubishi
    -0.63
    POSITIVE LOGITS
    1.43
    )。
    1.06
     。
    1.03
    出版年
    1.01
    __':
    1.00
    0.97
    )。
    0.95
    0.95
    0.95
    0.94
    Act Density 0.003%

    No Known Activations