INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Brown
    -0.07
    �述
    -0.07
     Power
    -0.07
    tures
    -0.07
     chó
    -0.07
    邪恶
    -0.07
    -0.07
     White
    -0.06
     fodder
    -0.06
    Integer
    -0.06
    POSITIVE LOGITS
    日本の
    0.08
     apresent
    0.07
     substitutes
    0.07
    0.07
    תח
    0.07
     affiliation
    0.07
     IHttpActionResult
    0.07
    0.07
    -cigaret
    0.07
    0.07
    Act Density 0.003%

    No Known Activations