东北石油大学研究生学位论文文献综述学号148003070665研究生姓名慕林洹学科、专业计算机技术论文题目基于Curvelet的地震数据压缩感知重建方法研究2015年11月20日东北石油大学研究生学位论文文献综述1文献综述1.前言近些年来,随着油气勘探的不断深入,勘探开发逐渐转向复杂油气藏,受复杂的地质条件影响,所采集到的地震资料常出现噪声干扰严重、信噪比低和有效信号能量弱的情况。甚至由于采集环境的影响,比如障碍物、禁采区和采集成本方面的考虑,以及一些废炮、废道的剔除,都会导致地震资料不规则和不完整。而后续的处理,如地震子波估计、多次波去除、偏移归位等,对采样率和地震数据的完整性、信噪比又有很高的要求,满足这些要求最直接的办法是在野外资料采集阶段对地震波场的采样和采集进行加密。但如前所述,很多时候受客观条件的限制,这种加密不易实现,同时也会增加野外采集的工作量和经济成本。这就需要在室内数据处理阶段对不完整的数据进行插值恢复,在已有不完整资料的基础上重建出完整数据,提高地震资料的质量。因此地震数据的重建已经成为一个非常重要的课题[1]。对于所采集的地震数据量,一方面,我们希望采集得越多越好,以获得更理想的恢复重建效果;另一方面,出于对海量数据压缩的需要,希望尽可能少地布置炮点和接收点,利用较少的数据就可以在随后的处理中恢复重建出理想的完整数据,以节约成本。这两方面似乎存在不可调和的矛盾[20]。而传统的奈奎斯特采样定理要求信号的采样频率必须大于或等于信号带宽的两倍,这无疑给地震数据的采集和存储提出了更高要求,也给相应的复杂油气勘探带来了极大挑战,这也成为目前包括地震信号处理在内的信息技术向前进一步发展的瓶颈之一。新近发展起来的压缩感知理论(CompressiveSensing,简称CS)给了我们新的启发。它指出,如果待处理的数据是稀疏的,再配以合适的采样方法,即使只有极少的不完整数据,采样比率或者平均采样间隔低于奈奎斯特采样定理所要求的极限,也有可能恢复出满足一定精度要求的完整数据[2]。而在地震勘探中,通常都能寻找到某种变换来稀疏表示地震数据,而且也可以通过设计一定的地震采集布线方法,在满足CS理论随机采样要求的同时,尽可能地减少炮点和接收点数,节约成本。2.地震数据重建的发展现状地震数据重建,即通过一定的策略和方法对不完整采样下的缺失地震道进行插值处理,恢复出完整的或者采样率更高的数据。1981年,Larner就对不完整地震道恢复和野外地震数据采集设计进行了深入的东北石油大学研究生学位论文文献综述2讨论和研究。自此之后,众多学者对该类技术进行了更深入的研究和发展。一般来说,地震数据重建方法可以归纳为三类,即基于滤波器的策略、采用波场算子的方法,以及基于某种变换的重建技术[3]。(1)基于滤波器的重建技术,是将待恢复数据与某种插值滤波器(如sinc函数)做卷积。缺点:这种方法通常将非均匀采样数据当作规则数据来处理,并通过高斯窗进行插值,这就容易造成较大误差,插值结果的不确定性较大。(2)基于算子的恢复重建方法,主要是通过正演和反演算子来迭代求解一个反问题[28]。缺点:需要有地下结构的先验信息,且计算量非常大,对采样率要求也较高,对于较粗网格采样的数据重建效果并不理想。(3)基于变换函数的传统重建方法,则是先对地震数据进行某种正变换编码,然后在变换域内做插值等处理后再进行逆变换解码。如基于傅里叶变换的波场恢复技术,Radon域恢复技术,还有利用Curvelet变换的方法[4]。与其他方法相比,这种方法计算效率更高,效果也比较理想。缺点:复杂度较高,重建效果还是不够好。按照所处理的不完整数据采样类型划分,地震数据恢复技术则经历了由均匀插值到不均匀插值的过程。而均匀采样不完整数据的插值,则又经历了在满足奈奎斯特采样定理要求情况下的插值技术到采样率低于奈奎斯特采样频率的抗假频插值方法的历程[5]。综上所述,降低采样率和不均匀采样数据重建都是比较棘手的问题。而传统的规则均匀采样受到奈奎斯特采样定理的限制,采样频率至少是信号最高频率的二倍,否则就容易出现假频现象,影响数据的重建。不过,奈奎斯特采样定理只是一个充分条件,在满足一定条件的情况下,低于奈奎斯特采样频率的欠采样数据仍然可以得到理想的恢复。新发展起来的压缩感知理论在数学上为此提供了更严密的框架,认为即使采样频率低于奈奎斯特极限,也有可能恢复出满足一定精度要求的完整数据[6]。3.压缩感知的发展现状近年来,基于信号稀疏性提出一种称为压缩感知或压缩采样的新兴采样理论成为应用数学与信号处理领域的一个全新研究方向[20]。该理论由加州大学洛杉矶分校的陶哲轩、斯坦福大学DavidDonoho及加州理工大学的EmmanuelCandès等提出并发展,自从2006年Donoho的论文正式发表之后,这一理论迅速引起国内外相关领域研究者的高度重视[7-9]。已有美国、英国、德国、法国、瑞士、以色列等许多国家东北石油大学研究生学位论文文献综述3的知名大学(如麻省理工学院,斯坦福大学,普林斯,顿大学,莱斯大学,杜克大学,慕尼黑工业大学,爱丁堡大学等)成立专门课题组对压缩感知进行研究[10]。目前国内有单位对压缩感知理论展开研究。如西安电子科技大学课题组基于该理论提出采用超低速率采样检测超宽带回波信号;中国科学院计算机研究所也成立了专门的课题组对压缩感知进行研究,并于2010年开设了“压缩感知理论”这门课程[11,12]。中科院电子所、西南交通大学、华南理工大学、北京交通大学、解放军理工大学等单位也开始着手研究。清华大学的唐刚,孔丽云,杨慧珠对压缩感知在地震数据的重建方面进行了深入的研究,压缩感知理论主要包括信号的稀疏表示、观测矩阵的设计与重构算法三个部分。信号的稀疏表示是信号可压缩感知的先决条件,考虑如何找到正交基或紧框架,使得信号在该域上是“稀疏”的;观测矩阵是获取信号结构化表示的手段,考虑如何构造观测矩阵,它应该满足什么样的性质,使得“稀疏”向量降维后重要信息不遭破坏;重构算法则是实现信号重构的保证,考虑如何从少量的线性测量重构原始信号。信号压缩感知流程示意图如下图所示:信号xn×1稀疏系数sn×1观测值ym×1信号xn×1变换域Ψn×n观测矩阵Ψn×n(m«n)重构算法图1信号压缩感知流程示意图3.1稀疏表示压缩感知技术首先要求信号是稀疏的或者可压缩的,但大部分信号本身并不稀疏。不过,如果其在某个变换域内满足此条件,同样适用于压缩感知理论。自从该理论框架被提出以来,常用的变换方法主要有离散余弦变换、傅里叶变换、小波变换和Curvelet变换等[13]。(1)离散余弦变换。优点:能量集中在低频;缺点:不能识别局部特征。(2)傅里叶变换。优点:理论完善,有快速算法;缺点:不能识别局部特征。短时傅里叶变换。优点:一定的局部频率识别能力;缺点:窗口大小不随时间和频东北石油大学研究生学位论文文献综述4率变化。(3)小波变换。优点:多尺度性,有效捕捉点奇异特征;缺点:不能有效捕捉线奇异特征。(4)Curvelet变换。优点:多尺度性,多方向性,各向异性,有效捕捉线奇异特征;缺点:非自适应变换基。综上所述相比其他变换,由于地震波形是多尺度,多方向,因此Curvelet变换最适用于地震数据稀疏表示,但还有改进的空间,因此基于Curvelet变换的地震数据压缩感知重建研究具有重要意义。3.2观测矩阵在信号的线性测量方面,主要是测量矩阵的设计,压缩感知中信号的线性测量最早是利用随机矩阵来实现的,如高斯矩阵,贝努利矩阵等[14,15]。Donoho在提出压缩感知的同时,指出了测量矩阵的特征:测量矩阵的列向量组成的子矩阵的最小奇异值应大于一定的常数,即列向量满足一定的线性独立性;测量矩阵的列向量要体现出某种类似噪声的独立随机性;满足稀疏度的解是满足L1范数最小的向量[16]。而Candès和Tao等人提出了著名的有限等距约束特性(RIP)理论,给出了测量矩阵应该满足的特性的具体形式。但是,直接判断一个矩阵是否满足RIP特性是一个非确定性多项式时间困难,即为NP-hard。Baraniuk又给出了RIP特性的等价条件[17,18]即非相干性定理。定理指出,当测量矩阵和变换矩阵不相干时,或者相干性非常小时,感知矩阵很大程度上满足RIP特性,线性测量后信息不丢失,信号重构时可以准确恢复原信号。3.3重构算法重构算法是压缩感知理论的核心之一。至今,已有众多国内外学者在信号重构领域做出了新的研究和探索。在信号重构方面,人们最早采用的是传统的最小化L2范数作为约束[19-22],然而对于这个优化问题求得的解通常并不具备稀疏性。随后相关学者又将注意力转移到以最小化L0范数作为约束,但是实践证明对此求解是一个NP难问题[23,24]。针对这一问题,大家又提出各种次优求解的算法例如最小化L1范数的优化求解,迭代贪婪算法,组合算法等[25,26]。在算法的计算复杂度和性能上都各有优劣。各国学者提出了许多稳定有效的信号重构算法。这些算法大致可以分为三类:东北石油大学研究生学位论文文献综述5第一类是基于L0范数最小化的贪婪算法,主要包括匹配追踪算法(MP),正交匹配追踪算法(OMP),正则化正交匹配追踪算法(ROMP),最优正交匹配追踪算法(OOMP),稀疏自适应匹配追踪算法(SAMP),分段正交匹配追踪算法(StOMP),子空间追踪算法(SP),压缩采样匹配追踪算法(CoSaMP),回溯型自适应正交匹配追踪算法(BAOMP)等。第二类是基于L1范数最小化的凸优化算法,主要包括基追踪算法(BP),内点迭代法,梯度投影算法(GPSR),最小全变差算法(TV),最小角度回归算法(LARS),同伦算法等。第三类是组合算法,主要包括链式追踪算法(CP),HHS追踪算法,傅里叶采样等。除了上述三大类主要的信号重构算法之外,迭代阈值法(ISA)也得到了广泛的应用。目前地震数据的重构算法一般都采用基于L1范数最小化的凸优化算法,而典型的L1范数最优化算法是基追踪算法(BP),它是基于线性规划的。但是,在实际应用中BP算法具有两个明显的问题:一方面,计算复杂度为高;另一方面,L1范数不能区分标记信号非零值的位置,这将导致低尺度的能量有可能迁移到高尺度。因此对BP算法的研究与改进具有重要意义。4.总结在实际地震数据采集中,受复杂环境或者采集仪器的限制,所采集的地震资料会出现不完整现象。而且,出于经济成本方面的考虑,要尽可减少数据的采集量,并希望能通过一定的处理方法恢复完整的数据。并且要求在采样比率或者平均采样间隔低于奈奎斯特采样定理所要求的极限,也有可能恢复出满足一定精度要求的完整数据。本文主要对目前较先进的压缩感知理论的算法及国内外发展现状进行了简要的介绍。从以上文献可知,采用压缩感知理论,选择合适的基函数表示地震数据,对降低采样率和提高重建质量有重要影响。通过Curvelet变换可以更稀疏地表示地震数据,更有效地捕捉地震波前有效特征,采用基追踪算法(BP)复杂度低,能够快速的实现重构。对以上算法进行分析与改进,再进行重构,这样一来,经其重建后的地震数据接近完整的地震数据,对地震勘探具有重要意义。东北石油大学研究生学位论文文献综述6参考文献[1]仝中飞.Curvelet阈值迭代法在地震数据去噪和插值中的应用研究[硕士学位论文].长春:吉林大学,2009.[2]李杰.图像的方向多尺度分析及其应用研究[D].电子科技大学,2007.[3]冯鑫.多尺度分析与压缩感知理论在图像处理中的应用研究[D].兰州理工大学,2012.[4]FenelonL.Nonequispaceddiscretecurvelettransformforseismicdatareconstruction[D].Vancouver:UniversityofBritishColumbia,2008.[5]CandesEJ,RombergJ.PracticalSignalRecoveryfromRandomprojections.ProceedingsofSPIEComputat