INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    о�
    -0.08
     Sh
    -0.06
    Name
    -0.06
    =$
    -0.06
    	E
    -0.06
    е�
    -0.06
    nin
    -0.06
    Ace
    -0.06
     Event
    -0.06
     بس
    -0.06
    POSITIVE LOGITS
    .setWindowTitle
    0.07
    بلغ
    0.07
    sect
    0.07
    nitř
    0.07
     (!(
    0.06
    иск
    0.06
    信用
    0.06
     Essay
    0.06
     внут
    0.06
    ]-->↵
    0.06
    Act Density 0.003%

    No Known Activations