INDEX

Explanations

offensive content requests

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

0.45

 plenty

0.44

 बेहतरीन

0.42

ちょっと

0.42

бычно

0.42

 occasionally

0.41

 occasional

0.41

 Flexible

0.41

 maybe

0.40

 sometimes

0.39

POSITIVE LOGITS

このような

0.81

这样一个

0.77

 چنین

0.77

 таком

0.76

 siquiera

0.75

 такому

0.74

 якобы

0.73

 ilyen

0.73

 allegedly

0.72

そのような

0.72

Activations Density 0.213%