INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     vort
    -0.09
    energ
    -0.08
     Rot
    -0.08
     kurs
    -0.08
     bane
    -0.08
     eczema
    -0.08
     adrenal
    -0.08
     fik
    -0.08
     traf
    -0.08
    adress
    -0.07
    POSITIVE LOGITS
     searchable
    0.08
     virtual
    0.08
    יפוש
    0.08
    ֶ
    0.08
     Ош
    0.08
    وجل
    0.08
     teilweise
    0.08
     verso
    0.08
     통한
    0.08
     parcialmente
    0.08
    Act Density 0.002%

    No Known Activations