INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.07
    .finish
    -0.07
     DAT
    -0.07
    DAT
    -0.07
    (head
    -0.07
    душ
    -0.07
    弟弟
    -0.07
    (ERROR
    -0.07
    logfile
    -0.07
    _TYPES
    -0.07
    POSITIVE LOGITS
    _Page
    0.08
     חד
    0.07
    stdarg
    0.07
    คา
    0.07
     automation
    0.07
     التعليم
    0.06
     automated
    0.06
    0.06
    コンテン
    0.06
    بط
    0.06
    Act Density 0.012%

    No Known Activations