INDEX
Explanations
This neuron selectively activates on mentions of the liver (and related “hepatic” terms).
New Auto-Interp
Negative Logits
athers
-0.07
.zone
-0.07
quent
-0.06
Mondays
-0.06
except
-0.06
subparagraph
-0.06
clid
-0.06
arter
-0.06
Amen
-0.06
ingredients
-0.06
POSITIVE LOGITS
UD
0.07
大学
0.07
主要
0.07
شهری
0.07
舗
0.06
firefight
0.06
竞
0.06
font
0.06
開始
0.06
DISPATCH
0.06
Activations Density 0.005%