INDEX

Explanations

markdown headers and code blocks

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

biss

0.41

 assertThat

0.41

oweit

0.40

essive

0.39

 వల్ల

0.36

োর্টের

0.36

 skirts

0.35

晟

0.35

}&\

0.35

 padd

0.35

POSITIVE LOGITS

Introduction

0.64

 Introduction

0.62

0.59

0.57

＃

0.52

Assignment

0.51

<h1>

0.50

การ

0.50

 Assignment

0.50

 INTRODUCTION

0.50

Activations Density 0.001%