INDEX
    Explanations

    various symbols and formatting characters in the text

    New Auto-Interp
    Negative Logits
     Kalman
    -0.75
     Thelma
    -0.69
     ſta
    -0.68
     obfer
    -0.68
    行った
    -0.67
     whofe
    -0.67
     ejus
    -0.67
     poffible
    -0.67
    出場
    -0.65
     Olin
    -0.65
    POSITIVE LOGITS
    1.06
    面に
    1.03
    ものに
    0.92
    月に
    0.92
    りに
    0.90
     に
    0.89
    かに
    0.88
    さに
    0.87
    時間に
    0.86
    기에
    0.85
    Act Density 0.027%

    No Known Activations