INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ihini
    -0.09
     nne
    -0.08
     الإمارات
    -0.08
    ophi
    -0.08
     έχουμε
    -0.08
    aphne
    -0.08
     Tuhan
    -0.08
     məsəl
    -0.08
     annon
    -0.08
     Aden
    -0.08
    POSITIVE LOGITS
    0.08
     proteg
    0.08
     proteção
    0.08
     leert
    0.08
     Storage
    0.07
     শেখ
    0.07
     leg
    0.07
     sanitation
    0.07
     estrateg
    0.07
    032
    0.07
    Act Density 0.002%

    No Known Activations