INDEX
    Explanations

    additional, addition, extra

    New Auto-Interp
    Negative Logits
    比較的
    0.43
     オール
    0.42
    िले
    0.39
    ುದ
    0.39
    }$-
    0.39
    いずれ
    0.39
     escolh
    0.38
    ags
    0.37
    ahydro
    0.37
    no
    0.36
    POSITIVE LOGITS
     tambahan
    0.84
     dodat
    0.75
     zusätzlich
    0.73
     additional
    0.72
     zusätzlichen
    0.69
     adicionales
    0.68
     thêm
    0.67
     추가
    0.67
     додат
    0.65
     adicional
    0.63
    Act Density 0.417%

    No Known Activations