INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ένα
    -0.08
     
    -0.07
    -0.07
    /
    -0.07
    —one
    -0.06
    έα
    -0.06
     [
    -0.06
    ',['
    -0.06
    ряд
    -0.06
    -{
    -0.06
    POSITIVE LOGITS
     Contin
    0.08
     Haz
    0.07
     yen
    0.07
     Replace
    0.07
    _blocks
    0.06
     Buen
    0.06
     COMPUT
    0.06
     Cit
    0.06
     rais
    0.06
     Stem
    0.06
    Act Density 0.243%

    No Known Activations