INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Communications
    -0.07
    .M
    -0.07
     traffic
    -0.07
     envy
    -0.07
     líqu
    -0.07
    _multiplier
    -0.07
    通讯
    -0.07
     intensified
    -0.07
    通信
    -0.07
     commun
    -0.07
    POSITIVE LOGITS
    添加
    0.13
     añadir
    0.12
     添加
    0.12
    Добав
    0.11
     adicionar
    0.11
     hinzufügen
    0.11
     добавить
    0.10
     thêm
    0.10
     Добав
    0.10
     agregar
    0.10
    Act Density 0.014%

    No Known Activations