INDEX
    Explanations

    أخرى مختلفة متعدد جديدة

    New Auto-Interp
    Negative Logits
     который
    1.03
     який
    0.97
     който
    0.90
     ayat
    0.87
     kuris
    0.86
     poema
    0.82
     الذي
    0.79
     करिकुलम
    0.78
     ktorý
    0.78
     který
    0.76
    POSITIVE LOGITS
     مختلفة
    1.20
     أخرى
    1.01
     جديدة
    1.01
    ٍ
    0.88
     متنوع
    0.85
     صغيرة
    0.82
     اخرى
    0.82
    ٌ
    0.81
     كبيرة
    0.80
     متعدد
    0.80
    Act Density 0.017%

    No Known Activations