INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     использовани
    -0.07
    kud
    -0.06
     Peace
    -0.06
    ombres
    -0.06
    LinkedList
    -0.06
     kodu
    -0.06
    XMLElement
    -0.06
     Amanda
    -0.06
    LIBINT
    -0.06
    生活
    -0.06
    POSITIVE LOGITS
     thighs
    0.14
     thigh
    0.12
    	cl
    0.07
     Cliff
    0.07
    0.07
     flank
    0.06
    -exec
    0.06
     ig
    0.06
    -plus
    0.06
     mean
    0.06
    Act Density 0.004%

    No Known Activations