INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ек
    -0.07
     jung
    -0.07
    англ
    -0.07
     Γι
    -0.06
     gee
    -0.06
    	Error
    -0.06
    еку
    -0.06
    -0.06
    ξύ
    -0.06
    により
    -0.06
    POSITIVE LOGITS
     supremacy
    0.07
     emulate
    0.07
     Bit
    0.07
     authentic
    0.06
     Nic
    0.06
    sis
    0.06
     fantasy
    0.06
     имеет
    0.06
    имер
    0.06
    .cur
    0.06
    Act Density 0.108%

    No Known Activations