INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     pregunta
    -0.08
     profesores
    -0.07
    )+
    -0.07
     حص
    -0.07
     fabricante
    -0.07
    Pregunta
    -0.07
     decimal
    -0.07
     Swar
    -0.07
     подраздел
    -0.07
    )}}
    -0.07
    POSITIVE LOGITS
     तुलना
    0.15
     vergleichen
    0.14
     comparaison
    0.14
     comparação
    0.14
     comparisons
    0.14
     comparison
    0.13
     Vergleich
    0.13
    Comparison
    0.13
     срав
    0.13
     vergelijken
    0.12
    Act Density 0.016%

    No Known Activations