INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    工业园
    -0.07
     Gil
    -0.07
     дорог
    -0.07
    غضب
    -0.07
    odal
    -0.07
     programm
    -0.07
     Holmes
    -0.07
    _nombre
    -0.06
     여행
    -0.06
    -0.06
    POSITIVE LOGITS
    tensorflow
    0.08
    ownership
    0.07
    0.07
    摄影作品
    0.07
    .groupby
    0.07
    Hit
    0.07
     Rece
    0.07
    されている
    0.07
    出身
    0.07
    گ
    0.06
    Act Density 0.005%

    No Known Activations