INDEX
Explanations
references to the name "Dan."
New Auto-Interp
Negative Logits
BaseActivity
-0.55
يميديا
-0.54
Vuitton
-0.54
mö
-0.53
gó
-0.53
Oye
-0.52
Pragma
-0.52
Vertra
-0.51
upo
-0.50
Visconti
-0.50
POSITIVE LOGITS
Dan
2.14
Dan
2.04
DAN
1.81
dan
1.76
DAN
1.66
dan
1.55
Daniel
1.48
Daniel
1.34
Dani
1.34
Danilo
1.27
Activations Density 0.110%