INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    личес
    -0.09
     במיוחד
    -0.09
    ಳೆ
    -0.08
     bookmark
    -0.08
    ánt
    -0.08
    אָט
    -0.08
     βιβ
    -0.08
    Sorting
    -0.08
    λω
    -0.08
    -0.08
    POSITIVE LOGITS
    公布
    0.18
    宣布
    0.16
     announcements
    0.15
     announcing
    0.15
    发布
    0.14
     घोषणा
    0.14
    公告
    0.14
     spokesperson
    0.14
     발표
    0.14
    發布
    0.14
    Act Density 0.216%

    No Known Activations