INDEX

Explanations

definitions reflecting traditional views on gender and sex.

contrast: primary vs secondary

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

Negative Logits

":{"

0.48

abilirsiniz

0.37

ered

0.36

 algum

0.36

的一些

0.35

的所有

0.35

ంది

0.34

Ja

0.34

},"

0.33

চ

0.33

POSITIVE LOGITS

 rather

2.16

而不是

2.13

而非

1.93

 instead

1.92

rather

1.87

 chứ

1.84

 plutôt

1.76

のではなく

1.75

ではなく

1.73

instead

1.73

Activations Density 0.779%