INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    itone
    -0.08
    _unc
    -0.08
    spy
    -0.07
     ndetse
    -0.07
     nylon
    -0.07
    -0.07
    spill
    -0.07
    _No
    -0.07
    oplastic
    -0.07
     hems
    -0.07
    POSITIVE LOGITS
     propon
    0.09
     Zel
    0.09
     richtige
    0.08
     recre
    0.07
     Timber
    0.07
     Saj
    0.07
     entsprechende
    0.07
     invo
    0.07
     comprom
    0.07
    ુક
    0.07
    Act Density 0.001%

    No Known Activations