INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Projection
    -0.07
     mov
    -0.06
    _translation
    -0.06
     addAction
    -0.06
    ください
    -0.06
    ební
    -0.06
     Photon
    -0.06
     joking
    -0.06
     bekannt
    -0.06
    olithic
    -0.06
    POSITIVE LOGITS
     impaired
    0.10
     impairment
    0.09
     impair
    0.08
     handicap
    0.07
    支援
    0.07
     pore
    0.07
     rub
    0.07
     impact
    0.07
     Imp
    0.06
    Peripheral
    0.06
    Act Density 0.008%

    No Known Activations