INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.08
     Zusammenhang
    -0.08
    nehmen
    -0.08
     deut
    -0.08
     parasites
    -0.08
    gegeben
    -0.08
     glatt
    -0.07
     Jonas
    -0.07
     Pach
    -0.07
    -0.07
    POSITIVE LOGITS
     Renaissance
    0.08
     photoc
    0.08
    Flower
    0.08
    0.08
    Alg
    0.08
     scars
    0.08
    Paperback
    0.08
     thou
    0.08
    Bos
    0.07
    AGO
    0.07
    Act Density 0.007%

    No Known Activations