INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    يسي
    -0.09
    Rx
    -0.08
     TN
    -0.08
    rx
    -0.08
     hem
    -0.08
    асы
    -0.07
    بيع
    -0.07
     allerg
    -0.07
    ίκη
    -0.07
    ست
    -0.07
    POSITIVE LOGITS
     ifad
    0.09
     expressions
    0.08
     curly
    0.08
     computations
    0.08
     mej
    0.08
    .Final
    0.08
     Eind
    0.08
    形式
    0.08
    0.07
     Baru
    0.07
    Act Density 0.004%

    No Known Activations