INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _TOO
    -0.08
    -0.07
     *)__
    -0.07
    -0.07
    IRTUAL
    -0.07
    מדבר
    -0.07
     sehr
    -0.07
    connect
    -0.07
     Virgin
    -0.07
     devast
    -0.07
    POSITIVE LOGITS
     zg
    0.08
     IMD
    0.07
    <Model
    0.07
    לכאורה
    0.07
     ik
    0.07
     Manila
    0.07
     Miami
    0.07
    0.06
    0.06
    _userid
    0.06
    Act Density 0.091%

    No Known Activations