INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     and
    -1.71
     the
    -1.70
     both
    -1.49
     not
    -1.49
     or
    -1.46
    你的
    -1.46
    高的
    -1.38
     AND
    -1.36
    มากๆ
    -1.35
     Universität
    -1.30
    POSITIVE LOGITS
     solucionar
    1.74
    Soorten
    1.71
     砖
    1.68
     trabajador
    1.63
     angesehen
    1.63
     comprometido
    1.55
    1.52
    1.51
    1.51
    elenco
    1.50
    Act Density 0.024%

    No Known Activations