INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _testing
    -0.07
    cmpeq
    -0.07
     nearer
    -0.06
     refugees
    -0.06
    UserName
    -0.06
    _people
    -0.06
    -0.06
     carbohydrates
    -0.06
    .components
    -0.06
     people
    -0.06
    POSITIVE LOGITS
     luaL
    0.07
     حفظ
    0.06
    OFF
    0.06
     hỏi
    0.06
    造成
    0.06
     Є
    0.06
    δης
    0.06
    ************************************************************************
    0.06
    овж
    0.06
    ينة
    0.06
    Act Density 0.082%

    No Known Activations