INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.08
     Spirits
    -0.08
     Pants
    -0.08
     Powers
    -0.08
     Clem
    -0.07
     Win
    -0.07
    liner
    -0.07
     Ubuntu
    -0.07
     شر
    -0.07
     Linux
    -0.07
    POSITIVE LOGITS
     మంది
    0.10
    多少
    0.09
    ERE
    0.08
     fewer
    0.08
     antidepress
    0.08
     എണ്ണം
    0.08
    是多少
    0.08
    ையும்
    0.08
     kalor
    0.07
     betaal
    0.07
    Act Density 0.009%

    No Known Activations