INDEX
Explanations
famous individuals named Jennifer
New Auto-Interp
Neuron Alignment
Index
Value
% of L₁
1757
+0.16
0.9%
874
+0.16
0.9%
370
+0.14
0.8%
Correlated Neurons
Index
P. Corr.
Cos Sim.
1097
+0.16
0.04
370
+0.16
0.03
501
+0.14
0.02
Negative Logits
<bos>
-1.06
Další
-0.88
Díky
-0.75
Více
-0.70
ⓧ
-0.67
Před
-0.65
يتيمه
-0.63
Při
-0.62
Při
-0.62
Výhody
-0.61
POSITIVE LOGITS
Jennifer
1.56
Jennifer
1.53
Jen
1.33
Jen
1.27
jennifer
1.22
Jenn
1.11
jennifer
1.07
Jenn
0.99
JEN
0.98
jen
0.87
Activations Density 0.346%