INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    )
    1.52
    >
    1.51
    de
    1.41
    2
    1.37
    <
    1.36
    It
    1.32
    ON
    1.31
    0
    1.30
    '
    1.29
    not
    1.25
    POSITIVE LOGITS
    ת
    1.32
    ین
    1.19
    تان
    1.16
    ות
    1.10
    ма
    1.09
    ித்த
    1.09
    то
    1.07
     σε
    1.07
    сход
    1.05
     punctato
    1.05
    Act Density 0.000%

    No Known Activations