INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     passa
    1.54
    1.52
     civile
    1.52
    u
    1.47
     fourni
    1.46
     simplifié
    1.45
     отличи
    1.42
    1.42
    下午
    1.41
     réalisé
    1.41
    POSITIVE LOGITS
    س
    2.25
    ل
    2.13
    1.98
    ма
    1.82
    ти
    1.71
    에서
    1.68
    ക്ക്
    1.64
    льних
    1.63
    britannien
    1.63
    de
    1.59
    Act Density 0.001%

    No Known Activations