本發(fā)明屬于水聲信號(hào)處理的一種水聲信號(hào)噪聲抑制方法,具體涉及了一種聯(lián)合雙模態(tài)神經(jīng)網(wǎng)絡(luò)與譜減法的水聲信號(hào)噪聲抑制方法。
背景技術(shù):
1、聲波是目前海洋中唯一可實(shí)現(xiàn)遠(yuǎn)距離傳播的能量輻射形式,作為信息載體,被廣泛應(yīng)用于潛艇探測(cè)、水下目標(biāo)識(shí)別、戰(zhàn)術(shù)通信和水下導(dǎo)航等任務(wù)。然而,聲信號(hào)接收平臺(tái)在運(yùn)行過程中會(huì)伴隨產(chǎn)生多種形式的自噪聲,包括機(jī)械振動(dòng)、電磁干擾和流體噪聲等。這些自噪聲嚴(yán)重影響了聲信號(hào)的接收質(zhì)量,不僅限制了設(shè)備的探測(cè)范圍,還削弱了聲信號(hào)的清晰度和可靠性,進(jìn)而對(duì)敵方目標(biāo)的精確定位和辨識(shí)造成困擾,嚴(yán)重時(shí)甚至對(duì)戰(zhàn)術(shù)決策的準(zhǔn)確性構(gòu)成威脅。因此,自噪聲抑制已成為聲信號(hào)接收平臺(tái)中的重要研究課題。
2、接收平臺(tái)自噪聲主要來源于螺旋槳轉(zhuǎn)動(dòng)產(chǎn)生的空化噪聲、推進(jìn)系統(tǒng)的機(jī)械振動(dòng)噪聲以及流體與船體摩擦引起的水動(dòng)力噪聲。受平臺(tái)運(yùn)動(dòng)狀態(tài)、推進(jìn)系統(tǒng)功率變化及機(jī)械結(jié)構(gòu)振動(dòng)等因素影響,該噪聲在時(shí)間和頻率上呈現(xiàn)高度非平穩(wěn)特性。
3、傳統(tǒng)自噪聲抑制方法如譜減法、自適應(yīng)濾波、小波變換和經(jīng)驗(yàn)?zāi)B(tài)分解等,在非平穩(wěn)噪聲環(huán)境下存在一些缺陷。首先,這類方法依賴于先驗(yàn)噪聲的統(tǒng)計(jì)特性,而接收平臺(tái)自噪聲具有時(shí)變和非平穩(wěn)特性,使得傳統(tǒng)方法難以動(dòng)態(tài)建模并適應(yīng)復(fù)雜的噪聲變化。而且傳統(tǒng)方法在抑制寬帶噪聲的同時(shí),往往會(huì)損害信號(hào)的線譜特征,導(dǎo)致目標(biāo)信息的丟失。此外,在復(fù)雜的海洋水聲環(huán)境中,混響效應(yīng)與噪聲相互耦合,進(jìn)一步降低了傳統(tǒng)算法的噪聲分離能力。
4、深度學(xué)習(xí)方法在水聲信號(hào)處理中展現(xiàn)出較強(qiáng)的特征提取能力,能夠在一定程度上分離信號(hào)中的不同成分。根據(jù)輸入特征的不同,現(xiàn)有深度學(xué)習(xí)降噪模型大致可分為兩類:基于頻譜圖和基于波形。前者通常通過短時(shí)傅里葉變換(stft)將音頻波形轉(zhuǎn)化為時(shí)頻譜圖,以提取頻率結(jié)構(gòu)信息,并進(jìn)一步細(xì)化為頻譜掩蔽和頻譜映射策略。但時(shí)頻域轉(zhuǎn)換在窗函數(shù)作用下會(huì)損失時(shí)間分辨率,且早期使用該類方法的研究中普遍忽略了對(duì)相位信息的建模,導(dǎo)致重建信號(hào)時(shí)存在失真,限制了降噪性能。后者則直接處理時(shí)域波形,保留了完整的相位信息并能更好地捕捉信號(hào)的瞬時(shí)變化特性,但在頻域建模方面存在不足,難以有效區(qū)分頻率上的噪聲與目標(biāo)成分。
5、鑒于平臺(tái)自噪聲在時(shí)間與頻率維度上具有復(fù)雜的結(jié)構(gòu)特征,單一模態(tài)處理方式在面對(duì)多樣性噪聲時(shí)往往適應(yīng)性不足。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供了一種聯(lián)合雙模態(tài)神經(jīng)網(wǎng)絡(luò)與譜減法的水聲信號(hào)噪聲抑制方法。針對(duì)水聲信號(hào)未知但平臺(tái)自噪聲可確定的特性,該方法利用雙模態(tài)神經(jīng)網(wǎng)絡(luò)提取并融合時(shí)域的高時(shí)間分辨率與譜域?qū)︻l率及相位特征的精準(zhǔn)建模能力,能夠在保留信號(hào)細(xì)節(jié)的同時(shí)顯著提升降噪性能,從而實(shí)現(xiàn)平臺(tái)自噪聲的估計(jì),并結(jié)合譜減法實(shí)現(xiàn)自噪聲抑制。該方法具有自主學(xué)習(xí)及高效降噪的能力,適用于非平穩(wěn)、復(fù)雜海洋環(huán)境下的水聲信號(hào)降噪,顯著提升低頻噪聲抑制能力與目標(biāo)信號(hào)保真度,提高接收的水聲信號(hào)質(zhì)量,減少了接收平臺(tái)自噪聲對(duì)信號(hào)的干擾,適用于水下聲學(xué)目標(biāo)探測(cè)、水聲通信等場(chǎng)景。
2、本發(fā)明的目的是通過以下技術(shù)方案來實(shí)現(xiàn)的:
3、一、一種聯(lián)合雙模態(tài)神經(jīng)網(wǎng)絡(luò)與譜減法的水聲信號(hào)噪聲抑制方法
4、步驟1:構(gòu)建含自噪聲的仿真水聲數(shù)據(jù)集;
5、步驟2:構(gòu)建雙模態(tài)神經(jīng)網(wǎng)絡(luò),接著利用含自噪聲的仿真水聲數(shù)據(jù)集對(duì)雙模態(tài)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直至訓(xùn)練完成,獲得平臺(tái)自噪聲估計(jì)模型;將待處理的含噪水聲信號(hào)輸入平臺(tái)自噪聲估計(jì)模型,模型輸出估計(jì)平臺(tái)自噪聲;
6、步驟3:基于估計(jì)平臺(tái)自噪聲,利用改進(jìn)的譜減法對(duì)待處理的含噪水聲信號(hào)進(jìn)行降噪處理后,獲得已降噪的水聲信號(hào)。
7、所述步驟1具體為:
8、首先,獲取接收平臺(tái)的自噪聲信號(hào);然后生成具有時(shí)變和非平穩(wěn)特性的仿真水聲信號(hào);最后,將接收平臺(tái)的自噪聲信號(hào)與各仿真水聲信號(hào)融合后生成含自噪聲的仿真水聲信號(hào),從而獲得含噪的仿真水聲數(shù)據(jù)集。
9、所述步驟2中,雙模態(tài)神經(jīng)網(wǎng)絡(luò)包括4個(gè)時(shí)域編碼器、4個(gè)時(shí)域解碼器、4個(gè)譜域編碼器、4個(gè)譜域解碼器和一個(gè)跨域transformer編碼器,4個(gè)時(shí)域編碼器依次相連,4個(gè)時(shí)域解碼器依次相連,4個(gè)譜域編碼器依次相連,4個(gè)譜域解碼器依次相連,第四時(shí)域編碼器和第一時(shí)域解碼器之間通過跨域transformer編碼器相連,第四時(shí)域編碼器和第一時(shí)域解碼器之間通過跨域transformer編碼器相連,第一時(shí)域編碼器還與第四時(shí)域解碼器相連,第二時(shí)域編碼器還與第三時(shí)域解碼器相連,第三時(shí)域編碼器還與第二時(shí)域解碼器相連,第四時(shí)域編碼器還與第一時(shí)域解碼器相連;第一譜域編碼器還與第四譜域解碼器相連,第二譜域編碼器還與第三譜域解碼器相連,第三譜域編碼器還與第二譜域解碼器相連,第四譜域編碼器還與第一譜域解碼器相連;雙模態(tài)神經(jīng)網(wǎng)絡(luò)的輸入作為第一時(shí)域編碼器的輸入,對(duì)雙模態(tài)神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行短時(shí)傅里葉變換后再輸入到第一譜域編碼器中,對(duì)第四譜域解碼器的輸出進(jìn)行逆短時(shí)傅里葉變換后再與第四時(shí)域解碼器的輸出疊加,最終獲得雙模態(tài)神經(jīng)網(wǎng)絡(luò)的輸出。
10、所述跨域transformer編碼器包括自注意力層和跨域注意力層,第一自注意力層依次經(jīng)第一跨域注意力層、第二自注意力層和第二跨域注意力層后再與第三自注意力層相連;第四自注意力層依次經(jīng)第三跨域注意力層、第五自注意力層和第四跨域注意力層后再與第六自注意力層相連;第一自注意力層的輸出還作為第三跨域注意力層的輸入,第二自注意力層的輸出還作為第四跨域注意力層的輸入;第四自注意力層的輸出還作為第一跨域注意力層的輸入,第五自注意力層的輸出還作為第二跨域注意力層的輸入,第三自注意力層和第六自注意力層的輸出分別作為跨域transformer編碼器的兩個(gè)輸出。
11、所述時(shí)域編碼器包括依次相連的第一一維卷積層、第一歸一化層、第一gelu激活層和第一殘差塊,時(shí)域編碼器的輸入作為第一一維卷積層的輸入,第一殘差塊的輸出作為時(shí)域編碼器的輸出;所述時(shí)域解碼器包括依次相連的第二一維卷積層、第二歸一化層、第二gelu激活層和第二殘差塊,時(shí)域解碼器的兩個(gè)輸入融合后再作為第二一維卷積層的輸入,第二殘差塊的輸出作為時(shí)域解碼器的輸出。
12、所述譜域編碼器依次相連的第一二維卷積層、第三歸一化層、第三gelu激活層和第三殘差塊,譜域編碼器的輸入作為第一二維卷積層的輸入,第三殘差塊的輸出作為譜域編碼器的輸出;所述譜域解碼器包括依次相連的第二二維卷積層、第四歸一化層、第四gelu激活層和第四殘差塊,譜域解碼器的兩個(gè)輸入融合后再作為第二二維卷積層的輸入,第四殘差塊的輸出作為譜域解碼器的輸出。
13、所述步驟3具體為:
14、步驟3.1:分別對(duì)估計(jì)平臺(tái)自噪聲和待處理的含噪水聲信號(hào)進(jìn)行短時(shí)傅里葉變換,分別獲得估計(jì)平臺(tái)噪聲和含噪水聲信號(hào)對(duì)應(yīng)的復(fù)數(shù)時(shí)頻譜值;
15、步驟3.2:根據(jù)估計(jì)平臺(tái)噪聲和含噪水聲信號(hào)對(duì)應(yīng)的復(fù)數(shù)時(shí)頻譜值生成兩者在頻率軸上的實(shí)時(shí)信噪比,根據(jù)兩者在頻率軸上的實(shí)時(shí)信噪比生成動(dòng)態(tài)的相減因子矩陣α;
16、步驟3.3:結(jié)合相減因子矩陣α,利用以下公式計(jì)算獲得已降噪水聲信號(hào)對(duì)應(yīng)的復(fù)數(shù)時(shí)頻譜值:
17、
18、其中,表示已降噪水聲信號(hào)的復(fù)數(shù)時(shí)頻譜幅度值,max(,)表示取最大值操作,x(f,t)表示含噪水聲信號(hào)的復(fù)數(shù)時(shí)頻譜值,表示估計(jì)平臺(tái)噪聲的復(fù)數(shù)時(shí)頻譜值,β表示噪聲閾值;||表示取幅值操作;
19、步驟3.4:對(duì)已降噪水聲信號(hào)對(duì)應(yīng)的復(fù)數(shù)時(shí)頻譜值進(jìn)行逆短時(shí)傅里葉變換后,獲得已降噪的水聲信號(hào)。
20、二、一種聯(lián)合雙模態(tài)神經(jīng)網(wǎng)絡(luò)與譜減法的水聲信號(hào)噪聲抑制裝置
21、數(shù)據(jù)集構(gòu)建單元,用于根據(jù)接收平臺(tái)的自噪聲信號(hào)構(gòu)建含自噪聲的仿真水聲數(shù)據(jù)集;
22、神經(jīng)網(wǎng)絡(luò)存儲(chǔ)單元,用于存儲(chǔ)雙模態(tài)神經(jīng)網(wǎng)絡(luò);
23、訓(xùn)練單元,用于利用含自噪聲的仿真水聲數(shù)據(jù)集對(duì)雙模態(tài)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直至訓(xùn)練完成,獲得平臺(tái)自噪聲估計(jì)模型;
24、信號(hào)降噪單元,用于將待處理的含噪水聲信號(hào)輸入平臺(tái)自噪聲估計(jì)模型,獲得估計(jì)平臺(tái)自噪聲;再基于估計(jì)平臺(tái)自噪聲,利用改進(jìn)的譜減法對(duì)待處理的含噪水聲信號(hào)進(jìn)行降噪處理后,獲得已降噪的水聲信號(hào)。
25、三、一種計(jì)算機(jī)設(shè)備
26、所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)所述一種聯(lián)合雙模態(tài)神經(jīng)網(wǎng)絡(luò)與譜減法的水聲信號(hào)噪聲抑制方法的步驟。
27、四、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
28、所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述一種聯(lián)合雙模態(tài)神經(jīng)網(wǎng)絡(luò)與譜減法的水聲信號(hào)噪聲抑制方法的步驟。
29、本發(fā)明的有益效果是:
30、1)本發(fā)明通過多物理場(chǎng)聯(lián)合仿真生成仿真水聲信號(hào)數(shù)據(jù)集,適用于實(shí)際環(huán)境下的水聲信號(hào)。
31、2)本發(fā)明考慮到平臺(tái)自噪聲類型明確且可事先采集,而目標(biāo)信號(hào)則在實(shí)際應(yīng)用中是動(dòng)態(tài)變化且未知的,因此通過使用雙模態(tài)神經(jīng)網(wǎng)絡(luò),提取信號(hào)時(shí)域波形特征,增強(qiáng)對(duì)瞬態(tài)噪聲的捕獲能力,時(shí)頻分支基于stft得到復(fù)數(shù)時(shí)頻譜特征,捕捉頻率和相位特征,并使用跨模態(tài)注意力機(jī)制融合雙模態(tài)信息,實(shí)現(xiàn)自噪聲特征的建模,這樣更能增強(qiáng)模型在多場(chǎng)景下的適應(yīng)性與泛化能力。
32、3)本發(fā)明通過譜減法根據(jù)實(shí)時(shí)信噪比動(dòng)態(tài)譜減系數(shù),引入基于實(shí)時(shí)信噪比估計(jì)的動(dòng)態(tài)譜減因子,結(jié)合功率譜密度曲線分析,實(shí)測(cè)信噪比提升可達(dá)30db以上。
33、4)本發(fā)明通過相位增益分析結(jié)果表明,本方法在相位信息重建上具有顯著優(yōu)勢(shì),其中95.77%的樣本呈現(xiàn)正向相位增益,最大相位增益達(dá)83.80%,體現(xiàn)了模型在相位恢復(fù)方面的有效性。