INDEX

Explanations

adverbs of truthfulness and seriousness

The neuron activates most strongly on discourse-marking adverbs (especially “honestly,” and to a lesser extent “seriously”) used to convey speaker emphasis or sincerity.

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

Negative Logits

 Langkah

-1.84

 рассказать

-1.66

’，

-1.62

 niedersachsen

-1.62

 Однако

-1.62

Также

-1.60

 karena

-1.59

товых

-1.59

ће

-1.51

jaket

-1.51

POSITIVE LOGITS

1.76

lossians

1.76

<bos>

1.72

ziehungs

1.65

henswürdigkeiten

1.64

ную

1.62

wości

1.61

 which

1.57

ter

1.56

quelize

1.56

Activations Density 0.002%