INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ILT
    -0.08
    fulness
    -0.08
     Jana
    -0.08
    Fel
    -0.07
     eff
    -0.07
    [address
    -0.07
    _addresses
    -0.07
     addresses
    -0.07
     fel
    -0.07
     fab
    -0.07
    POSITIVE LOGITS
     گذاری
    0.09
     Marquis
    0.08
    0.08
     бар
    0.08
     بار
    0.07
     Υ
    0.07
     mech
    0.07
    ы
    0.07
     ברור
    0.07
     Queen
    0.07
    Act Density 0.004%

    No Known Activations