INDEX

Explanations

beyond the superficial

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

प्ट

0.38

 रियल

0.37

 अफवाह

0.36

 reales

0.36

 реаль

0.36

 pomer

0.36

ₕ

0.36

 pril

0.35

∞

0.35

 dynam

0.35

POSITIVE LOGITS

 merely

0.73

 rote

0.61

 brute

0.61

 mere

0.59

 reactive

0.57

 Reactive

0.57

 superficial

0.56

Reactive

0.55

 단순히

0.55

 Descriptive

0.53

Activations Density 0.083%