INDEX

Explanations

action or state following easily

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

pay

0.64

 apologised

0.62

 also

0.62

слава

0.61

 connect

0.61

ack

0.59

qdm

0.58

don

0.58

缓

0.57

 avanzar

0.57

POSITIVE LOGITS

 photocopy

0.79

 추출

0.78

 disassembly

0.77

easily

0.76

 facilmente

0.75

 expropri

0.74

 counterfe

0.73

 Extracts

0.72

𝙴

0.72

 conception

0.72

Activations Density 0.409%