INDEX

Explanations

user experience and environment

New Auto-Interp

Top Features by Cosine Similarity

Configuration

Prompts (Dashboard)

10,000 prompts, 128 tokens each

Dataset (Dashboard)

lmsys/lmsys-chat-1m

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 stuff

-0.11

 Stuff

-0.10

-0.09

yla

-0.09

 beaut

-0.09

 stylist

-0.09

 Emperor

-0.08

 emperor

-0.08

 lore

-0.08

rops

-0.08

POSITIVE LOGITS

 experience

0.26

experience

0.20

 experiences

0.18

 solution

0.16

 Experience

0.15

Experience

0.15

 environment

0.15

 experiencia

0.14

 ê²½íĹĺ

0.13

 option

0.13

Activations Density 0.140%