INDEX
    Explanations

    new file and parameter definitions

    New Auto-Interp
    Negative Logits
    えっ
    -1.28
    ほら
    -1.13
     émotion
    -1.05
     obuv
    -1.02
     religieuse
    -1.00
    のですか
    -1.00
     magnétique
    -0.99
    -0.99
    pumpkin
    -0.98
     précédente
    -0.98
    POSITIVE LOGITS
     of
    1.08
    </b>
    1.06
     in
    1.04
     will
    0.94
    lamó
    0.92
     see
    0.92
    坦克
    0.91
    assioned
    0.89
     видом
    0.87
    *}{
    0.85
    Act Density 0.114%

    No Known Activations