INDEX

Explanations

math and jokes

New Auto-Interp

Top Features by Cosine Similarity

Configuration

Prompts (Dashboard)

10,000 prompts, 128 tokens each

Dataset (Dashboard)

lmsys/lmsys-chat-1m

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 equival

-0.09

kaar

-0.09

 conspir

-0.09

Å¡e

-0.09

 Spell

-0.09

ä¸Ī

-0.08

 Thesis

-0.08

_manual

-0.08

assis

-0.08

ç¯ĩ

-0.08

POSITIVE LOGITS

æķ°åŃ¦

0.22

 math

0.22

math

0.21

 Math

0.21

.math

0.20

Math

0.19

 Ð¼Ð°ÑĤÐµÐ¼Ð°ÑĤÐ¸

0.19

(math

0.17

 Ø§ÙĦØ±ÙĬØ§Ø¶

0.17

 mathematics

0.17

Activations Density 0.246%