INDEX
Explanations
medical conditions or symptoms
New Auto-Interp
Neuron Alignment
Index
Value
% of L₁
2019
+0.24
0.8%
1535
+0.23
0.8%
381
+0.14
0.5%
Correlated Neurons
Index
P. Corr.
Cos Sim.
2019
+0.24
0.13
1535
+0.23
0.12
1326
+0.14
0.09
Negative Logits
Lmfao
-0.94
FTFY
-0.91
Darum
-0.91
Może
-0.87
Czym
-0.87
Hahah
-0.85
Dlaczego
-0.82
Dziękuję
-0.82
Wię
-0.81
Leurs
-0.80
POSITIVE LOGITS
<bos>
1.01
hina
0.92
istan
0.87
bera
0.86
gmbh
0.82
:))
0.81
marte
0.81
»-
0.78
!«
0.78
hej
0.78
Activations Density 0.604%