INDEX
    Explanations

    Interview transcripts

    New Auto-Interp
    Negative Logits
    Evaluation
    -0.08
     רוב
    -0.08
    -Hand
    -0.08
     มือ
    -0.07
     kiểm
    -0.07
     yes
    -0.07
     cautious
    -0.07
     怎么
    -0.07
     handi
    -0.07
    :black
    -0.07
    POSITIVE LOGITS
    orden
    0.08
     ljub
    0.07
    olesc
    0.07
    আই
    0.07
    odio
    0.07
     Minas
    0.07
     Greenville
    0.07
    观点
    0.07
     ključ
    0.07
    enje
    0.07
    Act Density 0.018%

    No Known Activations