INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     گئیں
    0.53
    0.52
    ندہ
    0.49
     shrewd
    0.48
    ید
    0.47
     لیں
    0.47
    رك
    0.46
    عادة
    0.46
     ईरान
    0.46
    นด์
    0.45
    POSITIVE LOGITS
    0.54
    l
    0.49
       
    0.47
     hom
    0.46
    kl
    0.46
              
    0.45
    kr
    0.43
    nl
    0.43
               
    0.42
     Kl
    0.42
    Act Density 0.013%

    No Known Activations