INDEX
    Explanations

    Greek conjunction "αλλά"

    New Auto-Interp
    Negative Logits
     pracę
    0.28
    σκευ
    0.25
     ভিত্ত
    0.25
     νε
    0.25
     κε
    0.25
     ochrony
    0.24
     druž
    0.24
    υνα
    0.23
     gouttes
    0.23
     яе
    0.23
    POSITIVE LOGITS
    iden
    0.21
     ένας
    0.20
     могли
    0.19
    azi
    0.19
    autical
    0.19
    ible
    0.19
     despite
    0.19
    castle
    0.18
     المهم
    0.18
     तो
    0.18
    Act Density 0.001%

    No Known Activations