INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Zone
    -0.08
    -region
    -0.07
    区域
    -0.07
     par
    -0.07
    -0.07
     weers
    -0.07
    -0.07
     rahat
    -0.07
     sosial
    -0.07
     tunnel
    -0.07
    POSITIVE LOGITS
     محد
    0.08
     piled
    0.08
    0.08
     ספ
    0.08
     consciência
    0.08
    Consultar
    0.08
    mals
    0.08
    Pile
    0.07
    idium
    0.07
    Пос
    0.07
    Act Density 0.006%

    No Known Activations