INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Viv
    -0.09
     собой
    -0.08
     Fury
    -0.07
     пол
    -0.07
     BES
    -0.07
     начин
    -0.07
    ાજ
    -0.07
    Viv
    -0.07
     oprav
    -0.07
     gagn
    -0.07
    POSITIVE LOGITS
    0.09
    产权
    0.08
    交流
    0.08
    0.08
    รู้
    0.08
     cul
    0.08
    (ad
    0.08
    0.08
     banyere
    0.07
     chc
    0.07
    Act Density 0.042%

    No Known Activations