INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Calcul
    -0.09
    calcul
    -0.09
    Diagn
    -0.08
    Fy
    -0.08
    _REF
    -0.08
    Convert
    -0.08
    شير
    -0.08
     executive
    -0.08
    Telefon
    -0.07
    غة
    -0.07
    POSITIVE LOGITS
    动漫
    0.09
     развлеч
    0.09
     możliwość
    0.08
    喜欢
    0.08
     ci
    0.08
    漫画
    0.08
     पसंद
    0.08
    好き
    0.08
     Spaß
    0.08
     homen
    0.08
    Act Density 0.034%

    No Known Activations