INDEX

Explanations

statement evaluation, aggressive, structural

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

lesh

0.76

 Mour

0.69

jul

0.67

 mell

0.66

ér

0.65

 necessários

0.65

 భూ

0.64

лова

0.64

 morte

0.64

뎀

0.64

POSITIVE LOGITS

她的

0.76

 थी

0.72

 alcan

0.71

<unused2218>

0.70

是他

0.69

atá

0.69

 alcanzó

0.69

给她

0.69

 achieve

0.68

 clamps

0.68

Activations Density 0.000%