INDEX

Explanations

learn about, dive deep, create plan, comprehensive overview

New Auto-Interp

Top Features by Cosine Similarity

Configuration

Prompts (Dashboard)

10,000 prompts, 128 tokens each

Dataset (Dashboard)

lmsys/lmsys-chat-1m

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 zbyt

-0.10

 OVERRIDE

-0.09

illi

-0.08

Ø§ÙĥÙĨ

-0.08

adesh

-0.08

 Ð½ÐµÐ¿Ð¾ÑģÑĢÐµÐ´

-0.08

 pure

-0.07

isContained

-0.07

 znaj

-0.07

.lv

-0.07

POSITIVE LOGITS

 comprehensive

0.19

åħ¨éĿ¢

0.16

ç»¼åĲĪ

0.16

 compreh

0.16

 Comprehensive

0.15

 overall

0.14

å®Įæķ´

0.14

hol

0.14

prehensive

0.13

 complete

0.13

Activations Density 0.932%