INDEX
    Explanations

    replace placeholders

    New Auto-Interp
    Negative Logits
     startups
    -0.07
     aptitude
    -0.07
    发展
    -0.07
     discern
    -0.07
    经典
    -0.07
     Wealth
    -0.07
    ARC
    -0.07
     pes
    -0.07
     sug
    -0.07
     commend
    -0.07
    POSITIVE LOGITS
     ersetzen
    0.11
     Replace
    0.11
     заменить
    0.10
    下さい
    0.10
    0.10
     replace
    0.10
     reempl
    0.10
     replacing
    0.10
     ersetzt
    0.09
    replace
    0.09
    Act Density 0.015%

    No Known Activations