INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     deuren
    -0.08
     эксплуата
    -0.08
     jaarlijks
    -0.08
    gef
    -0.08
     Nazir
    -0.08
     gezamenlijk
    -0.08
     reconnaissance
    -0.08
    -0.08
    Exponent
    -0.08
     fysieke
    -0.07
    POSITIVE LOGITS
    優惠
    0.08
     orqali
    0.07
     verbre
    0.07
    0.07
     zvl
    0.07
    ərbayc
    0.07
    优惠
    0.07
     वेबसाइट
    0.07
     competency
    0.07
    0.07
    Act Density 0.015%

    No Known Activations