INDEX

Explanations

officers characters individuals who

New Auto-Interp

Top Features by Cosine Similarity

Configuration

Prompts (Dashboard)

10,000 prompts, 128 tokens each

Dataset (Dashboard)

lmsys/lmsys-chat-1m

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 redirects

-0.09

enet

-0.09

ibar

-0.09

bero

-0.09

andle

-0.09

quette

-0.09

 indispens

-0.09

Ext

-0.08

alm

-0.08

ulin

-0.08

POSITIVE LOGITS

 attempts

0.13

who

0.13

avig

0.11

pie

0.11

 trying

0.11

 attempt

0.11

 tries

0.11

 journey

0.10

nun

0.10

 thrust

0.10

Activations Density 0.097%