INDEX
    Explanations

    conjunctions of contrast

    New Auto-Interp
    Negative Logits
     supported
    0.53
     pois
    0.49
     infine
    0.45
    ുകൊണ്ട്
    0.43
    میں
    0.42
     voire
    0.42
     olyan
    0.40
     เนื่อง
    0.40
    {\"
    0.39
     گئی۔
    0.38
    POSITIVE LOGITS
     nhưng
    3.25
     ولكن
    3.13
     but
    3.11
     แต่
    3.02
     लेकिन
    2.98
     lakini
    2.97
     ngunit
    2.91
     لكن
    2.88
     mutta
    2.88
     אבל
    2.72
    Act Density 0.170%

    No Known Activations