INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _EXTENSION
    -0.07
    906
    -0.06
     domingo
    -0.06
     Criteria
    -0.06
     dee
    -0.06
    ์อ
    -0.06
    /posts
    -0.06
     Matthias
    -0.06
     Cooke
    -0.06
    ωνα
    -0.06
    POSITIVE LOGITS
     نيز
    0.07
    Erreur
    0.07
     '['
    0.07
    0.06
    afka
    0.06
    oran
    0.06
    	    		
    0.06
    arası
    0.06
    ůj
    0.06
    }}}
    0.06
    Act Density 0.000%

    No Known Activations