INDEX
    Explanations

    Foreign languages

    New Auto-Interp
    Negative Logits
     corrente
    -0.08
     básico
    -0.08
     טוב
    -0.08
    abele
    -0.07
    itten
    -0.07
     colocado
    -0.07
     furnace
    -0.07
     יפה
    -0.07
     كامل
    -0.07
     fronte
    -0.07
    POSITIVE LOGITS
    0.12
    ,而且
    0.11
    。また
    0.10
    0.10
     للغاية
    0.10
     kakhulu
    0.10
    ுள்ளதாக
    0.10
    ,同时
    0.09
    、有
    0.09
    ،
    0.09
    Act Density 0.049%

    No Known Activations