INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    etsk
    -0.09
    dued
    -0.09
     DU
    -0.07
     Sens
    -0.07
    _due
    -0.07
     Tack
    -0.07
     vanwege
    -0.07
     frag
    -0.07
    มาต
    -0.07
     modifiers
    -0.07
    POSITIVE LOGITS
     опыт
    0.08
    意见
    0.08
    经验
    0.08
     precedent
    0.08
     writings
    0.08
     lia
    0.07
     afar
    0.07
     выступ
    0.07
    akings
    0.07
     mistakes
    0.07
    Act Density 0.024%

    No Known Activations