INDEX

Explanations

detailed explanations

phrases that signal formal, comprehensive explanation or in-depth, detailed exposition.

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

Negative Logits

ziehungen

0.61

이가

0.46

 встанов

0.46

ɐ

0.46

 سوف

0.45

>("

0.44

 вступи

0.44

Probit

0.44

\|=\

0.44

щихся

0.44

POSITIVE LOGITS

 battery

0.41

 Battery

0.41

 belts

0.39

 hacks

0.39

 Insulin

0.39

 lens

0.39

 Molecules

0.38

 bands

0.38

on

0.38

 earrings

0.37

Activations Density 0.007%