INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     MIR
    -0.10
     mirac
    -0.08
     missionary
    -0.08
     яр
    -0.07
     adot
    -0.07
     Mission
    -0.07
     milag
    -0.07
     Wizard
    -0.07
     ничего
    -0.07
     SCR
    -0.07
    POSITIVE LOGITS
    -knit
    0.09
     uneasy
    0.09
     tensions
    0.08
     напряж
    0.08
    poon
    0.08
     Mano
    0.08
    Aware
    0.08
     tension
    0.08
     separat
    0.07
     HV
    0.07
    Act Density 0.007%

    No Known Activations