INDEX
Explanations
references to magazine covers and notable figures in fashion
New Auto-Interp
Neuron Alignment
Index
Value
% of L₁
50
+0.35
1.2%
678
+0.10
0.3%
1150
+0.08
0.3%
Correlated Neurons
Index
P. Corr.
Cos Sim.
924
+0.35
0.04
1150
+0.10
0.03
1912
+0.08
0.03
Negative Logits
<bos>
-1.50
Février
-0.79
Octobre
-0.75
ⓧ
-0.74
/**
-0.74
Septembre
-0.73
Décembre
-0.69
DockStyle
-0.68
Juillet
-0.68
Juin
-0.67
POSITIVE LOGITS
Cuer
0.78
magazine
0.78
Compañ
0.76
Alcalde
0.74
idolat
0.73
pym
0.71
Darío
0.70
article
0.68
Lucía
0.67
hacienda
0.67
Activations Density 0.567%