INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Jung
    -0.08
     Gest
    -0.08
    .G
    -0.08
     Jika
    -0.07
    -0.07
     directional
    -0.07
     نفس
    -0.07
     Vide
    -0.07
     kori
    -0.07
    Kung
    -0.07
    POSITIVE LOGITS
    очки
    0.08
    0.08
     embody
    0.08
     stå
    0.08
    0.07
    akin
    0.07
    avatar
    0.07
    ainne
    0.07
     थीं
    0.07
    448
    0.07
    Act Density 0.006%

    No Known Activations