INDEX
    Explanations

    contrast words

    New Auto-Interp
    Negative Logits
    nown
    -0.08
    Snap
    -0.08
    égi
    -0.08
     sweeping
    -0.08
     cola
    -0.07
    κό
    -0.07
     blanket
    -0.07
     diária
    -0.07
     CNT
    -0.07
    umblr
    -0.07
    POSITIVE LOGITS
     debo
    0.10
     jetzt
    0.09
     देर
    0.08
     কি
    0.08
     considero
    0.08
     überprüfen
    0.08
     모르
    0.08
     고려
    0.08
    ////////////////////////////////////////////////////////////////////////////////
    0.08
     Zusatz
    0.08
    Act Density 0.043%

    No Known Activations