INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    OLVE
    -0.08
    holm
    -0.07
    -0.07
     ike
    -0.07
    urin
    -0.07
     produzir
    -0.07
     illegally
    -0.07
     negotiate
    -0.07
    -0.07
     montagem
    -0.07
    POSITIVE LOGITS
     भगवान
    0.09
    >{@
    0.07
    mäßig
    0.07
    egu
    0.07
    ಿಸಿದೆ
    0.07
     pah
    0.07
     Tung
    0.07
    .Company
    0.07
     siente
    0.07
    prec
    0.07
    Act Density 0.002%

    No Known Activations