INDEX
    Explanations

    German language

    New Auto-Interp
    Negative Logits
    Tags
    -0.07
     ıs
    -0.07
    ngx
    -0.07
    BX
    -0.06
    tx
    -0.06
    Sk
    -0.06
    ۱
    -0.06
    Sweet
    -0.06
    okus
    -0.06
     WORD
    -0.06
    POSITIVE LOGITS
    nen
    0.08
    iben
    0.08
    lán
    0.07
    ählen
    0.07
    artisan
    0.07
     inward
    0.07
    ichern
    0.07
    _pen
    0.07
    achten
    0.07
     thin
    0.07
    Act Density 0.057%

    No Known Activations