INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     нік
    -0.07
     tense
    -0.07
     careless
    -0.07
     специ
    -0.07
    つけ
    -0.07
     сост
    -0.06
     příč
    -0.06
     menacing
    -0.06
    ijke
    -0.06
     디자인
    -0.06
    POSITIVE LOGITS
     hybrid
    0.18
     Hybrid
    0.16
     hybrids
    0.12
    ybrid
    0.08
    brid
    0.07
    brids
    0.07
    Hy
    0.07
     Har
    0.06
     wedding
    0.06
     MO
    0.06
    Act Density 0.004%

    No Known Activations