INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     NICE
    -0.07
    .inspect
    -0.07
     rubbing
    -0.07
    -0.07
    .xtext
    -0.07
    amani
    -0.07
    ambiri
    -0.07
     tom
    -0.07
     Africans
    -0.07
     membre
    -0.07
    POSITIVE LOGITS
     flutter
    0.09
    Gil
    0.09
     Gil
    0.08
    0.08
    0.08
    Extr
    0.08
    0.08
     blades
    0.08
    ŝ
    0.08
     Extr
    0.08
    Act Density 0.002%

    No Known Activations