INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Proto
    -0.07
     gl
    -0.07
    domést
    -0.07
    ógico
    -0.07
     funciona
    -0.07
     pronounce
    -0.07
    Proto
    -0.07
     ಹೆಸರು
    -0.07
     función
    -0.07
    -0.07
    POSITIVE LOGITS
    _part
    0.08
    πη
    0.08
    ijven
    0.08
     nero
    0.08
    adil
    0.08
     helft
    0.07
    ਨ੍ਹਾਂ
    0.07
    _frac
    0.07
    ccd
    0.07
    Dabei
    0.07
    Act Density 0.006%

    No Known Activations