INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     HCN
    0.77
    ی
    0.68
    ן
    0.67
     Lend
    0.65
    0.65
    ]."
    0.63
     indetermin
    0.63
     intran
    0.62
     ابراہیم
    0.62
     jaundice
    0.61
    POSITIVE LOGITS
    ب
    0.80
    ;
    0.76
    0.72
    ール
    0.71
    B
    0.69
    0.69
    0.67
     μπορεί
    0.66
    0.64
    ába
    0.64
    Act Density 0.001%

    No Known Activations