INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     kob
    -0.08
    ektion
    -0.08
     Porsche
    -0.08
    万元
    -0.07
    \Form
    -0.07
     punkt
    -0.07
     patriotic
    -0.07
     alkoh
    -0.07
     carbs
    -0.07
     hör
    -0.07
    POSITIVE LOGITS
     transplant
    0.10
     transplantation
    0.09
    (lhs
    0.09
     transpl
    0.08
     принад
    0.08
    交換
    0.08
     אחת
    0.08
     Exchange
    0.08
    0.08
     worth
    0.08
    Act Density 0.004%

    No Known Activations