INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.07
     administration
    -0.07
    uciones
    -0.07
     keypad
    -0.07
    -0.07
    ߘ
    -0.07
     wypos
    -0.07
     prove
    -0.06
     Zahl
    -0.06
    -0.06
    POSITIVE LOGITS
    >]
    0.08
    Roy
    0.07
    Pid
    0.07
    مهندس
    0.07
    oto
    0.07
    	md
    0.07
    0.07
     марта
    0.06
    discover
    0.06
    >_
    0.06
    Act Density 0.035%

    No Known Activations