INDEX
    Explanations

    common english words

    New Auto-Interp
    Negative Logits
    603
    -0.09
    Aux
    -0.08
    -0.07
     Aux
    -0.07
    Enum
    -0.07
     פנ
    -0.07
    -0.07
     pinned
    -0.07
    @
    -0.07
    Color
    -0.07
    POSITIVE LOGITS
     bedeut
    0.10
    والي
    0.09
     réput
    0.08
     betyd
    0.08
    ગી
    0.08
     accompl
    0.08
     montré
    0.08
     cultivated
    0.08
     Tory
    0.08
     प्रतिष्ठ
    0.08
    Act Density 0.659%

    No Known Activations