INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.08
     cytok
    -0.07
    kp
    -0.07
    -0.07
    -0.07
     тем
    -0.07
    فتم
    -0.07
     کیلومتر
    -0.07
     devastating
    -0.07
     буд
    -0.07
    POSITIVE LOGITS
    .AutoSize
    0.06
    />
    ↵
    0.06
     img
    0.06
    [now
    0.06
    Now
    0.06
     TForm
    0.06
     (↵
    0.05
    (grammar
    0.05
    0.05
    forget
    0.05
    Act Density 0.146%

    No Known Activations