INDEX

Explanations

finite approximations

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 TOEFL

0.43

ానికి

0.40

manufacturing

0.40

才能

0.39

ません

0.39

 চীনে

0.39

dnn

0.39

若

0.38

正月

0.38

선

0.38

POSITIVE LOGITS

 stabilized

0.45

 stabilize

0.44

 стабили

0.44

 pivoted

0.43

 symmetric

0.43

 meaningfully

0.42

 regra

0.42

 नियंत्रित

0.40

 swirling

0.40

 symmetry

0.40

Activations Density 0.001%