INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Knox
    -0.08
     CM
    -0.07
     Geheim
    -0.07
    .todo
    -0.07
    mand
    -0.07
     kiel
    -0.07
     alle
    -0.07
    iam
    -0.07
    _cm
    -0.07
     lés
    -0.07
    POSITIVE LOGITS
     edging
    0.08
    年底
    0.08
    0.08
    /on
    0.08
    юш
    0.08
     мес
    0.08
     مد
    0.07
     domu
    0.07
    Vit
    0.07
    0.07
    Act Density 0.036%

    No Known Activations