INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    LY
    -0.07
    ly
    -0.07
    ールド
    -0.07
     Han
    -0.07
    REN
    -0.06
     LD
    -0.06
     NA
    -0.06
     plush
    -0.06
    494
    -0.06
     firms
    -0.06
    POSITIVE LOGITS
     antibiotic
    0.12
     antibiotics
    0.12
     antibiot
    0.08
    oto
    0.07
     wegen
    0.07
    anko
    0.07
     droit
    0.07
    çi
    0.07
    جب
    0.07
     anymore
    0.07
    Act Density 0.003%

    No Known Activations