INDEX

Explanations

things emerging and their outcomes

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ating

0.55

ated

0.52

 समझा

0.52

ust

0.51

aker

0.51

inar

0.50

erman

0.49

ys

0.48

е

0.48

ert

0.47

POSITIVE LOGITS

 emergence

0.98

 emerge

0.96

 emerges

0.96

 ortaya

0.88

 emerging

0.86

 emerged

0.85

Emer

0.81

 Emer

0.80

 muncul

0.78

 Emerging

0.77

Activations Density 0.039%