本發(fā)明專利技術(shù)公開了一種正交追蹤算法在GPU上的并行實現(xiàn)方法,具體包括:S1、在GPU上生成觀測矩陣;S2、使用正交追蹤算法反復(fù)迭代估計原始信號,利用上述觀測矩陣計算出所述原始信號對應(yīng)的觀測數(shù)據(jù),并與真實觀測數(shù)據(jù)進(jìn)行比較,判斷是否終止所述迭代操作;S3、計算所述觀測矩陣中與殘差相關(guān)性最大的列,將其補充到基矩陣中,所述基矩陣為所述觀測矩陣的一部分;S4、利用最小二乘法在所述基矩陣中估計所述原始信號的非零元素,更新原始信號,繼續(xù)步驟S2。該方法能夠縮短正交追蹤算法的運行時間,達(dá)到提高數(shù)據(jù)處理效率、降低成本的目的。
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及信號處理
,具體涉及一種OMP (OrthogonalMatchingPursuit,正交追蹤算法)在GPU上的并行實現(xiàn)方法。
技術(shù)介紹
近年來,壓縮感知(CS)理論得到廣泛關(guān)注,其在信號滿足稀疏性的前提下,用遠(yuǎn)小于奈奎斯特采樣率的采樣頻率對數(shù)據(jù)進(jìn)行采樣,即能夠完全恢復(fù)出原始信號。壓縮感知用下面的數(shù)學(xué)表達(dá)式闡述為對于原始信號X e Rn,通過觀測矩陣Φ e Rmxn,得到觀測向量y e Rm :γ=φχ(I)其中M << Ν,χ中顯著元素個數(shù)為S,S << N。CS理論研究的是已知觀測y,估計滿足式(I)的最稀疏解X,即找到一個ieRA'滿足minimi。,s.t. y =ΦχI 2 )其中,Il · Il C1表示Ltl范數(shù),即計算非零元素個數(shù)。目前,針對式(2)的優(yōu)化問題,提出了一系列的求解算法,包括近似LI優(yōu)化、貪心算法、Focuss算法等,這些算法在特定場景下都能有效恢復(fù)出稀疏信號。然而,這類算法的·共同特點是計算復(fù)雜度高,在求解大規(guī)模數(shù)據(jù)時,傳統(tǒng)CPU串行實現(xiàn)運行時間長,無法實時恢復(fù)出原始稀疏信號;而借助大型計算機或者集群雖然能夠?qū)崿F(xiàn)快速計算,但所需成本高,不能滿足工程應(yīng)用的需求。近年來,圖形處理器(Graphics Processing Unit, GPU)演變成一個高速并行化的多核、多線程通用應(yīng)用平臺,在解決計算密集型問題上具有很高的性價比。本專利技術(shù)嘗試?yán)肎PU這一平臺來提高OMP算法的執(zhí)行速度。以下的文獻(xiàn)介紹了該領(lǐng)域主要的
技術(shù)介紹
1.Tropp J A, Gilbert A C. Signal recovery from random measurementsviaorthogonal matching pursuit.1EEE Transactions on InformationTheory, 2007, 53(12):4655-4666.文獻(xiàn)中,基于貪心算法提出了一種求解零范數(shù)最小優(yōu)化的算法,該算法相對于基于一范數(shù)近似的凸優(yōu)化算法計算復(fù)雜度更小,分辨率更高。相對于傳統(tǒng)的匹配跟蹤算法,每次迭代過程中正交投影增加了成功恢復(fù)的概率和收斂速度。2. Sangkyun Lee S W.1mplementing algorithms for signaland imagereconstruetion on graphical processing units.ComputerSciencesDepartment, University of Wisconsin-Madison, Tech. Rep. , November, 2008.文獻(xiàn)中,Wisconsin大學(xué)的Sangkyun Lee等人在GPU平臺上實現(xiàn)了壓縮感知的SpaRSA算法。SpaRSA算法是凸優(yōu)化算法的一種,計算復(fù)雜度比較大,即使在GPU平臺上實現(xiàn)依然需要較長的計算時間。同時,SpaRSA算法具有凸優(yōu)化類算法的共同缺點,就是存在較高的旁瓣。3. Andrecut M. Fast GPU implementation of sparse signal recoveryfromrandom projections. Engineering Letters. 2009, 17(3):151-158.在此文獻(xiàn)中,Calgary大學(xué)的Andrecut等人實現(xiàn)了匹配追蹤(Matching Pursuit,MP)算法的GPU并行化。該方法存在的缺點就是MP算法本身的收斂速度慢,在其相關(guān)性較大時,成功恢復(fù)的概率小。
技術(shù)實現(xiàn)思路
(一)要解決的技術(shù)問題本專利技術(shù)主要解決現(xiàn)有算法在求解大規(guī)模數(shù)據(jù)時,傳統(tǒng)CPU串行實現(xiàn)運行時間長、成本高的技術(shù)問題。(二)技術(shù)方案為解決上述問題,本專利技術(shù)提供了一種正交追蹤算法在GPU上的并行實現(xiàn)方法,包括以下步驟S1、在GPU上生成觀測矩陣;S2、使用正交追蹤算法反復(fù)迭代估計原始信號,利用上述觀測矩陣計算出所述原始信號對應(yīng)的觀測數(shù)據(jù),并與真實觀測數(shù)據(jù)進(jìn)行比較,判斷是否終止所述迭代操作;S3、計算所述觀測矩陣中與殘差相關(guān)性最大的列,將其補充到基矩陣中,所述基矩陣為所述觀測矩陣的一部分;S4、利用最小二乘法在所述基矩陣中估計所述原始信號的非零元素,更新原始信號,繼續(xù)步驟S2。在步驟SI中,所述觀測矩陣為對DCT離散余弦變換矩陣進(jìn)行隨機抽行得到的矩陣,其元素根據(jù)下面的公式計算 權(quán)利要求1.一種正交追蹤算法在GPU上的并行實現(xiàn)方法,其特征在于,包括以下步驟 51、在GPU上生成觀測矩陣; 52、使用正交追蹤算法反復(fù)迭代估計原始信號,利用上述觀測矩陣計算出所述原始信號對應(yīng)的觀測數(shù)據(jù),并與真實觀測數(shù)據(jù)進(jìn)行比較,判斷是否終止所述迭代操作; 53、計算所述觀測矩陣中與殘差相關(guān)性最大的列,將其補充到基矩陣中,所述基矩陣為所述觀測矩陣的一部分; 54、利用最小二乘法在所述基矩陣中估計所述原始信號的非零元素,更新原始信號,繼續(xù)步驟S2。2.如權(quán)利要求1所述的方法,其特征在于,在步驟SI中,所述觀測矩陣為對DCT離散余弦變換矩陣進(jìn)行隨機抽行得到的矩陣,其元素根據(jù)下面的公式計算 其中,O為觀測矩陣,m為行數(shù),m G (0, I, 2,---,N-l), n為列數(shù),N為正交追蹤算法待恢復(fù)信號的長度,h為計算機生成的偽隨機數(shù)序列,該序列中有M個元素,M為壓縮感知中的觀測數(shù),且M〈N。3.如權(quán)利要求2所述的方法,其特征在于,GPU將所述元素的生成任務(wù)分配到64個線程中,其中第i個線程負(fù)責(zé)生成(0(i,0),0(i,l),0(i,2),...,0 (i, N-1)),多個線程在多個處理器上并行完成觀測矩陣O的生成。4.如權(quán)利要求1所述的方法,其特征在于,在步驟S2中,所述迭代終止的條件是真實觀測數(shù)據(jù)與利用所述觀測矩陣計算出的觀測數(shù)據(jù)的方差低于指定門限值,用數(shù)學(xué)公式描述為 其中I為真實觀測數(shù)據(jù),o為觀測矩陣,t為在第k步迭代之后估計出的原始信號,£為相對誤差,其與觀測噪聲有關(guān),Ii Ii2表示向量的二范數(shù)。5.如權(quán)利要求4所述的方法,其特征在于,在GPU平臺上所述觀測矩陣與所述原始信號向量的乘法并行完成,每個流處理器負(fù)責(zé)所述觀測矩陣的一行與所述原始信號向量做內(nèi)積,在單個流處理器中,多線程并行對所述原始信號向量的部分元素進(jìn)行乘法操作,所述二范數(shù)的計算由多個線程并行執(zhí)行。6.如權(quán)利要求1所述的方法,其特征在于,在步驟S3中,GPU在計算所述觀測矩陣中各列與殘差的相關(guān)性過程中,GPU內(nèi)部的每個流處理器執(zhí)行一個列與殘差的相關(guān)性,最后比較各個流處理器的結(jié)果,將相關(guān)性最大的列擴展到基矩陣中。7.如權(quán)利要求1所述的方法,其特征在于,在步驟S4中,通過調(diào)用cublas的cublasDger函數(shù)來完成最小二乘估計。全文摘要本專利技術(shù)公開了一種正交追蹤算法在GPU上的并行實現(xiàn)方法,具體包括S1、在GPU上生成觀測矩陣;S2、使用正交追蹤算法反復(fù)迭代估計原始信號,利用上述觀測矩陣計算出所述原始信號對應(yīng)的觀測數(shù)據(jù),并與真實觀測數(shù)據(jù)進(jìn)行比較,判斷是否終止所述迭代操作;S3、計算所述觀測矩陣中與殘差相關(guān)性最大的列,將其補充到基矩陣中,所述基矩陣為所述觀測矩陣的一部分;S4、利用最小二乘法在所述基矩陣中估計所述原始本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點】
一種正交追蹤算法在GPU上的并行實現(xiàn)方法,其特征在于,包括以下步驟:S1、在GPU上生成觀測矩陣;S2、使用正交追蹤算法反復(fù)迭代估計原始信號,利用上述觀測矩陣計算出所述原始信號對應(yīng)的觀測數(shù)據(jù),并與真實觀測數(shù)據(jù)進(jìn)行比較,判斷是否終止所述迭代操作;S3、計算所述觀測矩陣中與殘差相關(guān)性最大的列,將其補充到基矩陣中,所述基矩陣為所述觀測矩陣的一部分;S4、利用最小二乘法在所述基矩陣中估計所述原始信號的非零元素,更新原始信號,繼續(xù)步驟S2。
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張顥,陳帥,孟華東,王希勤,
申請(專利權(quán))人:清華大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。