INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Fact
    -0.08
     CONTR
    -0.08
    الج
    -0.07
    gleichen
    -0.07
    ei
    -0.07
     Omega
    -0.07
     lun
    -0.07
    PAC
    -0.07
    PARATOR
    -0.07
    Needed
    -0.07
    POSITIVE LOGITS
    Lazy
    0.08
     cuestión
    0.08
     Dur
    0.07
     cheer
    0.07
     peg
    0.07
    0.07
     tcp
    0.07
     BP
    0.07
    ika
    0.07
     Kra
    0.07
    Act Density 0.010%

    No Known Activations