INDEX
    Explanations

    doors that are broken/ajar

    New Auto-Interp
    Negative Logits
    -0.09
     Fitness
    -0.09
    -0.08
    ixir
    -0.08
    工资
    -0.08
     gbas
    -0.08
     LTE
    -0.08
    -0.08
     elde
    -0.08
     يعيش
    -0.08
    POSITIVE LOGITS
     door
    0.17
     doors
    0.16
    Door
    0.15
     Door
    0.15
    Doors
    0.15
     двери
    0.15
     дверь
    0.15
    door
    0.14
     двер
    0.14
     Doors
    0.13
    Act Density 0.064%

    No Known Activations