INDEX

Explanations

same and similar comparison

New Auto-Interp

Top Features by Cosine Similarity

Configuration

Prompts (Dashboard)

10,000 prompts, 128 tokens each

Dataset (Dashboard)

lmsys/lmsys-chat-1m

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 Ð²Ð¾ÑĤ

-0.09

 anus

-0.09

 McMahon

-0.08

ãĤ£

-0.08

 háº¿t

-0.08

_named

-0.08

 Pulse

-0.08

':''

-0.08

ä¹İ

-0.08

 pulse

-0.08

POSITIVE LOGITS

 same

0.12

 similar

0.12

ä¹Łæĺ¯

0.11

TBD

0.11

 Same

0.11

Same

0.10

ãģĵãģ¡ãĤī

0.09

 Similar

0.09

 ìĹŃìĭľ

0.09

similar

0.09

Activations Density 0.051%