INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     mor
    -0.08
     dur
    -0.07
    Cham
    -0.07
    arsch
    -0.07
     attained
    -0.07
     Pra
    -0.07
    Shop
    -0.07
    Colon
    -0.07
     Tus
    -0.07
     Hause
    -0.07
    POSITIVE LOGITS
    most
    0.09
    力量
    0.08
    -born
    0.08
     तौर
    0.08
    073
    0.07
    /internal
    0.07
     observers
    0.07
    -facing
    0.07
    0.07
    0.07
    Act Density 0.014%

    No Known Activations