INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Coun
    -0.08
     counterpart
    -0.08
     Sk
    -0.08
    -0.08
     Camb
    -0.08
    -0.08
     دوره
    -0.08
     Lo
    -0.07
     reputable
    -0.07
    вел
    -0.07
    POSITIVE LOGITS
    Hint
    0.07
     мі
    0.07
    134
    0.07
    ár
    0.07
     pública
    0.07
     الرم
    0.07
    124
    0.07
    972
    0.07
    armor
    0.07
    0.07
    Act Density 0.083%

    No Known Activations