INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Wants
    -0.08
     Rubber
    -0.08
     Grim
    -0.08
     Wanted
    -0.08
     tread
    -0.08
     Railroad
    -0.07
    .Warn
    -0.07
     befinden
    -0.07
     zitten
    -0.07
     Zijn
    -0.07
    POSITIVE LOGITS
    照片
    0.09
     spectacular
    0.09
     photographs
    0.08
    写真
    0.08
     visuals
    0.08
     красоты
    0.08
     sari
    0.08
    漂亮
    0.08
     fotos
    0.08
    0.08
    Act Density 0.022%

    No Known Activations