INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    famil
    -0.07
     Bor
    -0.07
     governors
    -0.07
     vehicles
    -0.07
     combustion
    -0.07
     combust
    -0.07
    kehr
    -0.07
    -0.06
     solucion
    -0.06
     congest
    -0.06
    POSITIVE LOGITS
     tofu
    0.11
     assust
    0.08
    0.08
     עוב
    0.08
     détect
    0.08
     কাপ
    0.08
     דיר
    0.08
     مهر
    0.08
     damer
    0.08
    Detect
    0.07
    Act Density 0.007%

    No Known Activations