INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    .GraphicsUnit
    -0.08
    év
    -0.07
    angan
    -0.07
    ии
    -0.07
     ев
    -0.07
    legt
    -0.07
    -0.07
    𝘶
    -0.07
     Edu
    -0.07
    iveau
    -0.07
    POSITIVE LOGITS
     Likes
    0.07
     UIG
    0.07
    manufact
    0.07
     Yes
    0.06
    Posted
    0.06
    第三季度
    0.06
     Trainer
    0.06
     יה
    0.06
     yahoo
    0.06
     nord
    0.06
    Act Density 0.001%

    No Known Activations