INDEX

Explanations

same-sex relationships and identity

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

active

0.42

 slack

0.40

 KISS

0.38

slack

0.38

 active

0.37

𝚆

0.36

ACTIVE

0.36

 Slack

0.36

 actif

0.36

 విశ్వ

0.36

POSITIVE LOGITS

同

0.70

 homosexual

0.64

 same

0.62

Same

0.59

same

0.58

 Same

0.56

 homosexuality

0.55

gay

0.54

 SAME

0.52

 mismas

0.51

Activations Density 0.158%