INDEX

Explanations

fraud detection

The neuron activates on numeric tokens or quantity indicators (e.g. numbers and measurement units).

New Auto-Interp

Configuration

Prompts (Dashboard)

392,802 prompts, 256 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

Negative Logits

 mismas

0.63

なども

0.61

및

0.57

作為

0.54

cds

0.54

緎

0.54

 एवं

0.54

 moieties

0.53

༈

0.53

 illetve

0.53

POSITIVE LOGITS

赶紧

0.63

 rapidement

0.57

 plötzlich

0.56

女友

0.55

 rapidamente

0.54

 внима

0.54

 girlfriend

0.54

 szybko

0.53

 unknowingly

0.53

 Boyfriend

0.53

Activations Density 0.036%