INDEX
    Explanations

    both or extensive lists

    New Auto-Interp
    Negative Logits
    一個
    0.60
    的一个
    0.50
    另一个
    0.49
     outro
    0.48
    一个
    0.47
    另一种
    0.47
     একটি
    0.45
     outra
    0.45
     Variante
    0.45
    另一
    0.45
    POSITIVE LOGITS
     både
    1.00
     zowel
    0.97
     everything
    0.97
    everything
    0.89
     sowohl
    0.85
     both
    0.85
     zarówno
    0.83
     각종
    0.82
    包括
    0.80
    各项
    0.80
    Act Density 0.183%

    No Known Activations