INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     groove
    -0.08
    .XR
    -0.08
     ponu
    -0.07
    atile
    -0.07
     añad
    -0.07
     reakc
    -0.07
     реак
    -0.07
     sarcas
    -0.07
     bark
    -0.07
     sarcast
    -0.07
    POSITIVE LOGITS
    0.12
    _old
    0.11
     gamle
    0.10
     القديمة
    0.10
    .old
    0.10
     legado
    0.10
     migrated
    0.10
     oude
    0.10
     gamla
    0.10
     anciennes
    0.10
    Act Density 0.014%

    No Known Activations