INDEX

Explanations

X, deviantart, github, paypal

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 explique

1.09

م

1.09

which

1.05

 reconnaît

1.02

 which

1.01

 implique

0.96

0.95

 Bezug

0.94

0.91

 welche

0.91

POSITIVE LOGITS

鈽

0.92

 transduction

0.91

刄

0.89

asambhavam

0.87

 missionary

0.86

ز

0.86

 disobedience

0.85

 mitosis

0.84

}$&$

0.80

 ఇందులో

0.80

Activations Density 0.070%