INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     yoga
    -0.06
     floors
    -0.06
     land
    -0.06
     shave
    -0.06
     grouping
    -0.06
     deck
    -0.06
    Side
    -0.06
     hiking
    -0.06
     rev
    -0.06
     inequalities
    -0.06
    POSITIVE LOGITS
    ــــــــ
    0.07
    FontSize
    0.07
    Size
    0.07
    .span
    0.06
     komment
    0.06
     تور
    0.06
    ümüş
    0.06
    νοια
    0.06
    .unpack
    0.06
    guna
    0.06
    Act Density 0.003%

    No Known Activations