INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    .SECONDS
    -0.06
     vomiting
    -0.06
    _PERMISSION
    -0.06
     Proceed
    -0.06
    ×↵↵
    -0.06
     تماس
    -0.06
     بسیار
    -0.06
    “For
    -0.06
     cùng
    -0.06
     utilisateur
    -0.06
    POSITIVE LOGITS
    .cat
    0.07
     espaço
    0.07
     typingsSlinky
    0.06
    ��
    0.06
     перест
    0.06
     (...
    0.06
    alfa
    0.06
     масла
    0.06
     Ψ
    0.06
    spots
    0.06
    Act Density 0.000%

    No Known Activations