INDEX

Explanations

layers, components, Results, word, connection, shift

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

がいい

0.42

 twinkle

0.38

 Indexed

0.38

 Heir

0.37

Bris

0.36

 দোকান

0.36

Dial

0.36

 всеми

0.36

ᄌ

0.36

 cumplen

0.35

POSITIVE LOGITS

indsight

0.42

܂

0.41

savvy

0.40

qst

0.39

ग्विजय

0.39

 अंतर्गत

0.39

ipynb

0.39

üsseldorf

0.38

ueger

0.38

দর্শী

0.38

Activations Density 0.000%