INDEX

Explanations

generating model responses

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 nhiều

0.82

 flera

0.82

 stronger

0.82

 många

0.79

蝌

0.79

 რამდენ

0.78

 surprised

0.77

 muitos

0.75

 එය

0.75

 چندین

0.75

POSITIVE LOGITS

 Important

0.66

%-

0.63

স্কার

0.61

 مهم

0.61

 organizing

0.59

important

0.59

 important

0.59

√

0.59

mp

0.59

шти

0.58

Activations Density 0.045%