INDEX

Explanations

classifying specific domains or concepts

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

urlar

0.49

 cause

0.43

 sufr

0.43

 kinases

0.43

Salle

0.43

ীতি

0.42

 sculptor

0.42

CSS

0.40

 subir

0.40

関

0.40

POSITIVE LOGITS

kelijke

0.49

 അവളുടെ

0.48

荣耀

0.45

颌

0.45

prehensive

0.45

诙

0.44

ocrite

0.44

 يصبح

0.43

 agréable

0.43

 Glückwunsch

0.42

Activations Density 0.011%