INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    工程
    -0.08
     knob
    -0.08
     bench
    -0.08
     benches
    -0.08
     Verständnis
    -0.07
     {:?
    -0.07
     reliant
    -0.07
    زمان
    -0.07
     engineers
    -0.07
     حدوث
    -0.07
    POSITIVE LOGITS
     sín
    0.08
    Aval
    0.08
     AVC
    0.08
     Guan
    0.07
    0.07
     kuv
    0.07
     exfol
    0.07
     keur
    0.07
     arbeitet
    0.07
    配送
    0.07
    Act Density 0.010%

    No Known Activations