INDEX

Explanations

personality

New Auto-Interp

Configuration

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ote

-0.09

 injunction

-0.09

ありが

-0.08

 slave

-0.08

Slave

-0.08

 infrastr

-0.08

 slaves

-0.07

 negatieve

-0.07

dae

-0.07

 complained

-0.07

POSITIVE LOGITS

 personality

0.25

 Persönlichkeit

0.25

 Personality

0.23

 personnalité

0.22

 personalidad

0.22

 personalidade

0.21

 personalities

0.18

 assessments

0.18

 persoonlijk

0.18

人格

0.17

Activations Density 0.047%