INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    elsen
    -0.09
    und
    -0.08
    rowning
    -0.08
    olo
    -0.08
    xor
    -0.07
    atan
    -0.07
    lock
    -0.07
     compare
    -0.07
    ctor
    -0.07
    noch
    -0.07
    POSITIVE LOGITS
     ქს
    0.09
     تخ
    0.09
     مليون
    0.09
     استخ
    0.09
     χρήση
    0.09
     استعمال
    0.09
     ტელ
    0.09
     Nesta
    0.09
     ناحية
    0.08
    ეილ
    0.08
    Act Density 0.008%

    No Known Activations