INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     τό
    -0.08
    embedding
    -0.07
     přih
    -0.07
     Rek
    -0.07
    ,全
    -0.07
     vul
    -0.06
    _connector
    -0.06
     Colleg
    -0.06
    _mono
    -0.06
     beginnings
    -0.06
    POSITIVE LOGITS
     větší
    0.06
    -marker
    0.06
     лица
    0.06
     occupies
    0.06
    _PE
    0.06
    datatype
    0.06
     línea
    0.06
     خبر
    0.06
     malaysia
    0.06
     volatile
    0.06
    Act Density 0.009%

    No Known Activations