INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     motorway
    -0.08
    lk
    -0.07
     maze
    -0.07
     machinery
    -0.07
    anze
    -0.07
    此次
    -0.07
    -0.07
    -0.07
     edital
    -0.07
    -0.07
    POSITIVE LOGITS
    几点
    0.11
    0.08
     നിര്
    0.08
    0.08
    ρίζ
    0.08
     момен
    0.08
    ത്ര
    0.08
     þr
    0.08
    τυ
    0.07
    აძ
    0.07
    Act Density 0.021%

    No Known Activations