INDEX
    Explanations

    punctuation

    New Auto-Interp
    Negative Logits
     tempér
    -0.08
    lıklı
    -0.08
     produto
    -0.08
     apoio
    -0.08
     support
    -0.08
     vocht
    -0.08
    όμενο
    -0.08
    _support
    -0.07
     Unterstützung
    -0.07
    וצר
    -0.07
    POSITIVE LOGITS
     срав
    0.10
     तुलना
    0.10
     Comparison
    0.10
     comparar
    0.10
     comparaison
    0.09
     comparación
    0.09
     비교
    0.09
     Worth
    0.09
    comparison
    0.09
     сравн
    0.09
    Act Density 0.045%

    No Known Activations