INDEX

Explanations

finding simple patterns

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

<unused23>

0.52

า

0.51

ʬ

0.50

𝐂

0.50

icherheit

0.49

 इलेक्ट्रॉनिक

0.49

梩

0.49

 jego

0.48

<unused250>

0.48

镍

0.48

POSITIVE LOGITS

Qu

0.44

 Maintain

0.43

Hid

0.42

وب

0.42

 maintain

0.40

 isolating

0.39

 Recognize

0.38

 sharing

0.37

 maintaining

0.36

Activations Density 0.001%