INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    hai
    -0.08
    ethi
    -0.07
     garment
    -0.07
    Office
    -0.07
     Powers
    -0.07
     haber
    -0.07
    -0.07
     மீ
    -0.07
    гэ
    -0.07
    pheric
    -0.07
    POSITIVE LOGITS
    bildung
    0.08
     negoc
    0.08
    0.08
     pont
    0.08
     dav
    0.08
     hinges
    0.08
     Дав
    0.08
    ə
    0.08
     Род
    0.08
    0.07
    Act Density 0.003%

    No Known Activations