INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Tan
    -0.08
     vinyl
    -0.08
     kadar
    -0.08
    Realm
    -0.07
    Tan
    -0.07
     valor
    -0.07
     tenu
    -0.07
     idol
    -0.07
    PH
    -0.07
     patented
    -0.07
    POSITIVE LOGITS
     erg
    0.09
     herm
    0.08
     unim
    0.08
     publicity
    0.08
    0.07
    eschool
    0.07
    леб
    0.07
    för
    0.07
     Koch
    0.07
    0.07
    Act Density 0.005%

    No Known Activations