INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    イス
    0.71
    ش
    0.69
    cèle
    0.66
    이스
    0.65
    де
    0.64
    }",
    0.64
    рії
    0.64
    лма
    0.61
     devrez
    0.61
    количество
    0.61
    POSITIVE LOGITS
    5
    1.02
    0
    0.95
    9
    0.90
    8
    0.86
    6
    0.77
    7
    0.71
    3
    0.69
    4
    0.69
    ü
    0.67
     by
    0.64
    Act Density 0.035%

    No Known Activations