INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    3
    -0.08
    2
    -0.07
    管理局
    -0.07
    .groups
    -0.07
    ברה
    -0.06
    地球上
    -0.06
     dataList
    -0.06
    emouth
    -0.06
    .course
    -0.06
    =
    -0.06
    POSITIVE LOGITS
    коло
    0.08
     ولا
    0.07
     עכשיו
    0.07
     renovations
    0.07
    allocator
    0.07
     kto
    0.07
    さんの
    0.07
    Dans
    0.07
     akşam
    0.07
     Jetzt
    0.07
    Act Density 0.009%

    No Known Activations