INDEX

Explanations

classroom, classes, II

New Auto-Interp

Top Features by Cosine Similarity

Configuration

Prompts (Dashboard)

10,000 prompts, 128 tokens each

Dataset (Dashboard)

lmsys/lmsys-chat-1m

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

:\n\n\n\n

-0.12

(){}\n

-0.10

__':\n

-0.10

...\n\n\n

-0.10

âĢ¦.\n\n

-0.10

__":\n

-0.10

:\n\n\n

-0.09

`}\n

-0.09

...\n\n\n\n

-0.09

?\n\n\n\n

-0.09

POSITIVE LOGITS

 {}\n\n

0.14

__()\n\n

0.14

>\n\n

0.14

{}\n\n

0.14

')\n\n

0.14

([]);\n\n

0.14

 '');\n\n

0.13

")\n\n

0.13

';\n\n

0.13

');\n\n

0.13

Activations Density 0.116%