INDEX

Explanations

discussing things together

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 如果

0.29

 নিজেকে

0.29

与

0.26

de

0.25

 자신의

0.25

ตัวเอง

0.25

len

0.25

 Contains

0.25

与

0.24

 ৫৫

0.24

POSITIVE LOGITS

 juntos

0.46

 جميعا

0.43

 gemeinsamen

0.34

 saling

0.33

 모두

0.33

 birbir

0.32

 collectively

0.31

 gemeinsam

0.31

都很

0.30

 elkaar

0.30

Activations Density 0.100%