INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     bienestar
    -0.09
    واح
    -0.08
     richtig
    -0.08
    عى
    -0.08
     sog
    -0.08
     Wind
    -0.07
    三区
    -0.07
     spanning
    -0.07
     progressively
    -0.07
     сон
    -0.07
    POSITIVE LOGITS
     same
    0.09
    Same
    0.09
     그대로
    0.09
     معه
    0.09
    _same
    0.09
     동일
    0.09
     samma
    0.09
     वही
    0.09
     contigo
    0.09
     unchanged
    0.08
    Act Density 0.046%

    No Known Activations