INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     نج
    -0.08
     lebens
    -0.08
    ellaneous
    -0.07
     Ablauf
    -0.07
     الحديث
    -0.07
     essentiel
    -0.07
     terme
    -0.07
     bij
    -0.07
     Debbie
    -0.07
     professionelle
    -0.07
    POSITIVE LOGITS
    CSC
    0.09
    Beacon
    0.07
    Bean
    0.07
    normalize
    0.07
    CS
    0.07
    Clase
    0.07
     hangt
    0.07
     paa
    0.07
     normalization
    0.07
    isin
    0.07
    Act Density 0.000%

    No Known Activations