INDEX
    Explanations

    German "Ich" statements

    New Auto-Interp
    Negative Logits
     exceeds
    0.58
     являются
    0.53
    takes
    0.50
     performs
    0.49
     நான்
    0.49
     असतात
    0.49
     applies
    0.49
     வருகின்றனர்
    0.48
     enjoys
    0.47
     ఉంటాయి
    0.47
    POSITIVE LOGITS
    zelf
    0.81
     نے
    0.52
     persönlich
    0.47
    ths
    0.45
     лично
    0.44
     hätte
    0.44
    klich
    0.42
     habl
    0.41
    zący
    0.41
    glu
    0.40
    Act Density 0.005%

    No Known Activations