INDEX
    Explanations

    parentheses followed by replace

    New Auto-Interp
    Negative Logits
    ان
    1.67
    ب
    1.41
    1.40
    1.30
    bbero
    1.27
    zelfde
    1.17
    ról
    1.16
    なっている
    1.16
    o
    1.16
    و
    1.12
    POSITIVE LOGITS
    !!!
    1.13
    }$,
    1.11
    ?’
    1.04
     refills
    1.03
    },
    1.02
    ты
    1.00
    )$
    0.98
    %,
    0.97
     확보
    0.97
    }$
    0.96
    Act Density 0.446%

    No Known Activations