INDEX

Explanations

accuracy and precision

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

charisma

0.39

罒

0.38

rody

0.37

素敵

0.36

ủng

0.36

jah

0.36

ించింది

0.35

 charismatic

0.35

রামর্শ

0.35

冚

0.35

POSITIVE LOGITS

 accurate

3.94

 accuracy

3.70

 Accurate

3.55

accurate

3.52

准确

3.47

 Accuracy

3.44

 accurately

3.31

Accuracy

3.28

accuracy

3.27

 정확

3.25

Activations Density 0.267%