INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 profits

0.63

нім

0.62

правля

0.59

 melamine

0.59

 capabilities

0.58

妗

0.56

 twist

0.55

 backdrop

0.55

itatively

0.55

一定的

0.55

POSITIVE LOGITS

durch

0.79

 который

0.78

 Từ

0.77

รั่ง

0.77

serie

0.75

 Когда

0.73

cuando

0.73

ą

0.73

suma

0.73

 когда

0.73

Activations Density 0.000%

No Known Activations

This feature has no known activations.