INDEX

Explanations

punishment and penalties

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

permit

-0.88

湯

-0.85

conio

-0.82

 scrittore

-0.82

 armis

-0.82

 Permit

-0.81

 Angebote

-0.81

claimers

-0.80

าศ

-0.79

 decrypt

-0.78

POSITIVE LOGITS

 imposed

2.02

 inflicted

1.61

 levied

1.38

imposed

1.35

 impose

1.30

 severity

1.27

 administered

1.16

impose

1.13

 imposition

1.13

 prescribed

1.10

Activations Density 0.026%