INDEX

Explanations

philosophy and thought phrases

New Auto-Interp

Top Features by Cosine Similarity

Configuration

Prompts (Dashboard)

10,000 prompts, 128 tokens each

Dataset (Dashboard)

lmsys/lmsys-chat-1m

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

hap

-0.09

oola

-0.09

apesh

-0.09

 éĸ

-0.09

 Heaven

-0.09

quin

-0.08

ãĥ¼ãĥ³

-0.08

abee

-0.08

 facts

-0.08

toLocale

-0.08

POSITIVE LOGITS

åĵ²

0.34

 philosophy

0.33

 philosophical

0.32

 Philosophy

0.29

 philosoph

0.26

phil

0.25

 Philosoph

0.24

 ÙģÙĦØ³

0.23

 philosophers

0.22

 felse

0.21

Activations Density 0.366%