INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _MAY
    -0.08
    คอย
    -0.07
     nouns
    -0.07
    -0.07
     itemView
    -0.07
     контрол
    -0.07
    WAYS
    -0.07
     forcefully
    -0.07
     actionTypes
    -0.07
     למנוע
    -0.07
    POSITIVE LOGITS
     Mult
    0.07
     Jag
    0.07
    Sal
    0.07
    0.07
    orption
    0.07
    一家
    0.07
    xxx
    0.07
    なんです
    0.07
    实效
    0.07
     rẻ
    0.07
    Act Density 0.001%

    No Known Activations