INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 slimy

0.57

 slippery

0.56

itación

0.54

၈

0.53

이었다

0.52

 ennemis

0.52

െ

0.52

 lutte

0.50

بھ

0.50

変更

0.49

POSITIVE LOGITS

0.55

 submarine

0.49

0.48

sex

0.47

 lacus

0.47

 volta

0.46

aso

0.46

 speaker

0.46

::

0.45

 skater

0.45

Activations Density 0.000%

No Known Activations

This feature has no known activations.