INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     supported
    -0.08
    ọt
    -0.08
     μπορού
    -0.08
    viert
    -0.07
     bati
    -0.07
    anho
    -0.07
     Wave
    -0.07
     indicador
    -0.07
     brat
    -0.07
    ували
    -0.07
    POSITIVE LOGITS
    Forbidden
    0.09
    Duplicates
    0.08
     bans
    0.08
     taboo
    0.08
     bisherigen
    0.08
    已有
    0.08
     Forbidden
    0.08
    Avoid
    0.08
    Reserved
    0.08
     مناف
    0.08
    Act Density 0.018%

    No Known Activations