INDEX

Explanations

anti-Semitic variety or homophobia

New Auto-Interp

Configuration

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

å¯¹åĩĨ

-0.06

uid

-0.06

ansk

-0.05

ì¡°

-0.05

eras

-0.05

 samb

-0.05

sta

-0.05

åĮħæĭ¬ä½Ĩä¸įéĻĲäºİ

-0.05

åľ¨åĵªåĦ¿

-0.05

vid

-0.05

POSITIVE LOGITS

ffield

0.06

åºĶè¯ī

0.06

affen

0.06

 consul

0.05

æĭľ

0.05

æķ´

0.05

à¹Ģà¸īà¸¥à¸µà¹Īà¸¢

0.05

 halves

0.05

æķ´é«Ķ

0.05

 ØªØ¹Ø¯Ø§Ø¯

0.05

Activations Density 0.004%