INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ~=
    -0.06
    	DB
    -0.06
     Activ
    -0.06
     цього
    -0.06
    _Sh
    -0.06
    ']['
    -0.06
    ’autres
    -0.06
     інш
    -0.06
    agrant
    -0.06
     уб
    -0.06
    POSITIVE LOGITS
    0.07
     recom
    0.06
    IBLE
    0.06
    prev
    0.06
    ises
    0.06
    ğı
    0.06
    upply
    0.06
    ngle
    0.06
    methodPointerType
    0.06
     ghi
    0.06
    Act Density 0.000%

    No Known Activations