INDEX

Explanations

listing types and categories

New Auto-Interp

Top Features by Cosine Similarity

Configuration

Prompts (Dashboard)

10,000 prompts, 128 tokens each

Dataset (Dashboard)

lmsys/lmsys-chat-1m

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ships

-0.09

 Classified

-0.09

 classified

-0.08

 Variant

-0.08

 variant

-0.08

 subsidiaries

-0.08

 Trab

-0.08

 submarines

-0.08

POSITIVE LOGITS

 categories

0.48

 category

0.45

 types

0.41

 Categories

0.35

Categories

0.33

 ÐºÐ°ÑĤÐµÐ³Ð¾ÑĢ

0.33

categories

0.32

category

0.31

 categorie

0.30

 type

0.30

Activations Density 0.294%