INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    sb
    -0.08
     healthier
    -0.08
     gezondheid
    -0.08
    áles
    -0.08
     oti
    -0.08
     involve
    -0.08
    -0.07
     opge
    -0.07
     الإنتاج
    -0.07
     kesehatan
    -0.07
    POSITIVE LOGITS
     riche
    0.24
     rich
    0.24
     богат
    0.23
     rica
    0.22
     ricos
    0.22
     Rich
    0.21
    Rich
    0.21
     rijk
    0.21
     reich
    0.21
    rich
    0.20
    Act Density 0.015%

    No Known Activations