INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Hamilton
    -0.10
    Hamilton
    -0.08
    医院
    -0.08
     благодар
    -0.08
     आनंद
    -0.08
    ため
    -0.08
     مجلس
    -0.08
    政府
    -0.08
    untamiento
    -0.08
     нож
    -0.08
    POSITIVE LOGITS
     exponential
    0.10
    0.08
    _TLS
    0.08
    Suc
    0.08
    diensten
    0.08
     Lös
    0.08
     WOR
    0.08
     fluct
    0.07
     Verizon
    0.07
    _hr
    0.07
    Act Density 0.043%

    No Known Activations