INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _Pin
    -0.07
     oo
    -0.07
     ow
    -0.07
     نمونه
    -0.07
     mph
    -0.07
     presidente
    -0.07
     smashed
    -0.07
    imento
    -0.06
    _sim
    -0.06
     пацієн
    -0.06
    POSITIVE LOGITS
     Kv
    0.07
    欧美
    0.07
     associations
    0.06
     STRICT
    0.06
    िक
    0.06
    قط
    0.06
    _when
    0.06
    0.06
     mỹ
    0.06
     pron
    0.06
    Act Density 0.009%

    No Known Activations