INDEX

Explanations

sarcasm and irony

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 true

0.57

 confound

0.56

 conspir

0.56

true

0.55

 امور

0.53

 uncontroll

0.53

犯

0.53

 unnecessarily

0.53

 confounded

0.53

 conclusiones

0.52

POSITIVE LOGITS

 conveniently

0.80

 laughable

0.78

 irony

0.75

呵呵

0.68

 ironic

0.68

Conven

0.62

 sarcasm

0.62

諷

0.62

 Convenient

0.61

🙄

0.61

Activations Density 0.157%