INDEX
    Explanations

    punctuation marks, especially quotation marks

    New Auto-Interp
    Negative Logits
    eſt
    -0.90
    leſs
    -0.90
    iffion
    -0.89
    bibfield
    -0.88
     queſta
    -0.86
     Houſe
    -0.86
     Jefus
    -0.85
    bibinfo
    -0.85
     Reſ
    -0.85
     Inſ
    -0.83
    POSITIVE LOGITS
    }}
    0.85
    ))
    0.85
    })
    0.84
    ագրություններ
    0.81
    </code>
    0.80
    __':
    0.80
    }`
    0.79
    }$
    0.79
    )
    0.79
    0.77
    Act Density 0.181%

    No Known Activations