INDEX
Explanations
The neuron fires on the word “terminal.”
New Auto-Interp
Negative Logits
dog
-0.07
.Id
-0.06
([
-0.06
rq
-0.06
ضافة
-0.06
очі
-0.06
音樂
-0.06
ellen
-0.06
丈夫
-0.06
Sản
-0.06
POSITIVE LOGITS
-Петерб
0.07
...)↵
0.07
vekili
0.06
downloading
0.06
_rom
0.06
.unsplash
0.06
において
0.06
correspondent
0.06
_travel
0.06
fascination
0.06
Activations Density 0.065%