INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.07
    Pl
    -0.07
     procesamiento
    -0.07
     pros
    -0.07
    pl
    -0.07
    OKIE
    -0.07
     salida
    -0.07
    बाट
    -0.07
     suffice
    -0.07
     aʻe
    -0.07
    POSITIVE LOGITS
     bepaalde
    0.09
     특정
    0.09
     tertentu
    0.08
     asian
    0.08
     κάν
    0.08
     tiver
    0.08
    eson
    0.08
     certaines
    0.08
    уул
    0.08
     cok
    0.08
    Act Density 0.024%

    No Known Activations