INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Liber
    -0.09
     Jays
    -0.09
     Lisaks
    -0.08
    otrop
    -0.08
     Salamanca
    -0.08
     Outra
    -0.08
     پار
    -0.08
     Olimp
    -0.08
    自由
    -0.08
     Parlamento
    -0.08
    POSITIVE LOGITS
    ,[
    0.08
     median
    0.08
    中央値
    0.07
    female
    0.07
     coinc
    0.07
    median
    0.07
     balances
    0.07
    Im
    0.07
     imput
    0.07
    mid
    0.07
    Act Density 0.013%

    No Known Activations