INDEX
    Explanations

    words related to legal and formal contexts

    New Auto-Interp
    Negative Logits
     geschichten
    -0.17
     techn
    -0.16
     kvin
    -0.15
     lesbische
    -0.15
     bü
    -0.15
     tie
    -0.15
    zent
    -0.14
    rech
    -0.14
     mechan
    -0.14
    üns
    -0.14
    POSITIVE LOGITS
     och
    0.24
     till
    0.23
     på
    0.21
     av
    0.19
     eller
    0.19
     tv
    0.19
    å
    0.19
     efter
    0.18
    emy
    0.18
     ens
    0.18
    Act Density 0.236%

    No Known Activations