INDEX

Explanations

Minimization and maximization

New Auto-Interp

Configuration

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 специаль

-0.08

 spezielle

-0.08

 måste

-0.08

special

-0.07

 неправиль

-0.07

詳

-0.07

 Must

-0.07

必

-0.07

 Fifth

-0.07

 repente

-0.07

POSITIVE LOGITS

 möglichst

0.32

 maximize

0.28

 όσο

0.27

尽

0.27

 minimize

0.26

 maximizing

0.24

 minimizes

0.24

 cât

0.23

 ideally

0.22

 minimizing

0.22

Activations Density 0.168%