INDEX

Explanations

taking charge, risks, or advantage

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

مت

0.80

0.78

رت

0.77

ी

0.77

Containing

0.76

Let

0.74

кі

0.74

Se

0.74

Guide

0.74

**

0.73

POSITIVE LOGITS

 advantage

2.02

 care

1.54

 aback

1.47

 heed

1.46

 cogniz

1.43

 avantage

1.33

advantage

1.32

 pains

1.30

 liberties

1.29

 pride

1.28

Activations Density 0.101%