INDEX
    Explanations

    Quotes/bold

    New Auto-Interp
    Negative Logits
    -0.08
    hid
    -0.07
     hinge
    -0.07
    ANN
    -0.07
     cons
    -0.07
     grpc
    -0.07
     ftp
    -0.07
     fertility
    -0.07
    Bench
    -0.06
     цена
    -0.06
    POSITIVE LOGITS
     lov
    0.09
     beiden
    0.08
     genannten
    0.08
     Evans
    0.08
     bestehenden
    0.08
     बल्कि
    0.08
    Mash
    0.08
    Lov
    0.07
    0.07
     Mey
    0.07
    Act Density 0.086%

    No Known Activations