INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ataupun
    0.30
     그리고
    0.28
     وهذا
    0.28
     ಮತ್ತ
    0.28
    UseVisualStyle
    0.27
    <unused338>
    0.26
     或者
    0.26
     দেওয়ার
    0.26
     மற்றொரு
    0.26
     কিংবা
    0.26
    POSITIVE LOGITS
    0.61
    <ul>
    0.58
     Firstly
    0.58
     firstly
    0.55
    *:
    0.54
    :
    0.52
    まず
    0.52
    Firstly
    0.51
    一是
    0.51
    首先
    0.50
    Act Density 6.194%

    No Known Activations