INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     livre
    -0.09
     Svens
    -0.08
     catalytic
    -0.08
     મુ
    -0.08
     ارسال
    -0.07
     Soto
    -0.07
     tava
    -0.07
    .artist
    -0.07
     whims
    -0.07
     protein
    -0.07
    POSITIVE LOGITS
    教程
    0.11
    知识
    0.10
     educating
    0.09
    olt
    0.09
     educate
    0.09
    培训
    0.09
    课堂
    0.09
    0.09
    课程
    0.09
     Unterricht
    0.09
    Act Density 0.006%

    No Known Activations