INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Burning
    -0.06
    عمال
    -0.06
    ovně
    -0.06
     Jana
    -0.06
    ودی
    -0.06
     उद
    -0.06
    企業
    -0.06
     برگز
    -0.06
    Holiday
    -0.06
     reconsider
    -0.06
    POSITIVE LOGITS
     правиль
    0.06
                                                                                       
    0.06
    ekk
    0.06
    _expr
    0.06
    -class
    0.06
    	source
    0.06
     doit
    0.06
    005
    0.06
    	word
    0.06
    いや
    0.06
    Act Density 0.000%

    No Known Activations