INDEX
    Explanations

    identifying kinds or types

    New Auto-Interp
    Negative Logits
    这是一
    0.21
    是一个
    0.20
    <0x0D>
    0.19
         
    0.19
    Reasons
    0.19
     Meaning
    0.19
     состо
    0.19
     Corresponding
    0.19
    Result
    0.19
     adalah
    0.18
    POSITIVE LOGITS
     kind
    0.42
     idea
    0.38
     aspect
    0.38
     तरह
    0.38
     distinction
    0.37
     sort
    0.36
     exact
    0.34
     type
    0.34
     stuff
    0.33
     craziness
    0.33
    Act Density 0.498%

    No Known Activations