INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.08
    amh
    -0.08
     nonlinear
    -0.08
    -0.08
    ول
    -0.08
     reson
    -0.08
     folklore
    -0.07
    -0.07
     canon
    -0.07
     Roman
    -0.07
    POSITIVE LOGITS
     electrons
    0.10
     ബാങ്ക
    0.09
    銀行
    0.09
     transmitted
    0.09
     aangesloten
    0.09
     ಬ್ಯಾಂ
    0.09
     übertragen
    0.09
     transfert
    0.09
     انتقال
    0.09
     certeza
    0.09
    Act Density 0.003%

    No Known Activations