INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    elernt
    0.52
     monitor
    0.51
    向けの
    0.48
    ্টা
    0.47
     получать
    0.47
    おく
    0.47
    RO
    0.47
     cellphone
    0.46
     ഭാര്യ
    0.46
    minist
    0.46
    POSITIVE LOGITS
     proteinuria
    0.47
     हम
    0.46
     εργ
    0.45
     אנחנו
    0.45
     seeds
    0.45
     हमने
    0.43
     се
    0.42
    0.41
     κου
    0.41
     بە
    0.41
    Act Density 0.003%

    No Known Activations