INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     epistem
    0.86
    0.81
     ihop
    0.78
     quartic
    0.76
     ตัว
    0.75
     ครับ
    0.72
     นั่น
    0.72
     metastases
    0.72
     ($\
    0.70
     bilinear
    0.70
    POSITIVE LOGITS
     
    1.12
    2
    0.92
    1
    0.89
    ২৬
    0.76
    ২৯
    0.75
    ২৭
    0.74
     ২০
    0.71
     ২৩
    0.71
     ১৫
    0.69
     ২৬
    0.67
    Act Density 0.026%

    No Known Activations