INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    .**
    0.75
    }}\
    0.75
    ");</
    0.75
    WER
    0.73
    <unused469>
    0.70
    .").
    0.69
    roy
    0.68
    .].
    0.68
     }}^{
    0.68
     اکبر
    0.68
    POSITIVE LOGITS
     eles
    0.89
    พวกเขา
    0.83
     เขา
    0.82
    เขา
    0.82
     他们
    0.81
    他们
    0.80
    Dia
    0.78
    Ils
    0.77
    idic
    0.75
    They
    0.75
    Act Density 0.203%

    No Known Activations