INDEX

Explanations

punctuation

New Auto-Interp

Configuration

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 faktiskt

-0.08

 faktisk

-0.08

 tatsächlich

-0.08

 correctly

-0.07

ויב

-0.07

 confirmed

-0.07

 effectivement

-0.07

 실제

-0.07

 selbstverständlich

-0.07

utanga

-0.07

POSITIVE LOGITS

 difficult

0.41

 difficiles

0.38

 difícil

0.37

 moeilijk

0.37

 сложно

0.37

 difíciles

0.37

 difíceis

0.37

 Hard

0.36

 difficile

0.36

 complicado

0.35

Activations Density 0.302%