INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     inspire
    -0.08
     stamp
    -0.08
    เรื่อง
    -0.08
     inspiring
    -0.08
    urst
    -0.08
    Legenda
    -0.07
     effectiveness
    -0.07
    nich
    -0.07
    reuse
    -0.07
     Cem
    -0.07
    POSITIVE LOGITS
     مباشر
    0.09
     veículo
    0.09
    ğa
    0.08
     доступа
    0.08
    0.08
    0.07
     प्राप्त
    0.07
     acesso
    0.07
     sonder
    0.07
     избавиться
    0.07
    Act Density 0.002%

    No Known Activations