INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Antio
    -0.09
     beitragen
    -0.09
     convection
    -0.08
     treten
    -0.08
     شبكة
    -0.08
     رکھ
    -0.08
     Strand
    -0.08
     XIX
    -0.08
     لعب
    -0.08
     قوة
    -0.08
    POSITIVE LOGITS
    -y
    0.08
     vlog
    0.08
    ings
    0.08
    abox
    0.08
    outs
    0.08
     reviewing
    0.08
    0.08
     обз
    0.08
    valuation
    0.08
     обзор
    0.08
    Act Density 0.031%

    No Known Activations