INDEX
    Explanations

    German past participles

    New Auto-Interp
    Negative Logits
    iranje
    0.50
    IZING
    0.50
    iranja
    0.49
    isierung
    0.48
    ificación
    0.48
    izing
    0.46
    лювання
    0.46
    ização
    0.46
    ведение
    0.45
    하기
    0.44
    POSITIVE LOGITS
    etzt
    0.66
    rieben
    0.65
    ommen
    0.65
    ichtet
    0.64
    ählt
    0.61
    chnitten
    0.59
    utzt
    0.58
    prochen
    0.58
    iseerd
    0.57
    ührt
    0.53
    Act Density 0.004%

    No Known Activations