中文字幕s级优女区,欧美人人草,色综合九九,伊香蕉大综综综合久久,久久99精品久久久久久牛牛影视,国产成人综合久久,中文久草

基于流形近鄰包絡(luò)轉(zhuǎn)置投影的PD語音樣本處理及應(yīng)用方法

文檔序號:42591409發(fā)布日期:2025-07-29 17:43閱讀:8來源:國知局

本發(fā)明涉及帕金森病(pd)語音智能診斷,尤其涉及基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理及應(yīng)用方法。


背景技術(shù):

1、近年來,基于機器學(xué)習(xí)的語音分析方法已被驗證能可靠地區(qū)分帕金森病(pd)患者與健康人,并用于疾病診斷、監(jiān)測及療法評估,已成為研究熱點。特征學(xué)習(xí)是該方法的關(guān)鍵,一般包括特征選擇和特征變換兩大類,其能夠有效地從高維的原始數(shù)據(jù)中提取最優(yōu)特征集,減少冗余信息和噪聲的干擾,有助于提高識別準確性。特征變換方法雖然可能重構(gòu)更高質(zhì)量的新特征,但損壞甚至丟失了原特征的病理學(xué)意義。特征選擇方法不僅同樣能提高后續(xù)準確率,而且可以保留原特征的病理學(xué)意義。

2、圖1是現(xiàn)有pd語音診斷特征選擇算法的流程圖,在采集到帕金森語音數(shù)據(jù)集后,采用特征選擇算法(前端法或后端法)進行特征選擇,得到優(yōu)質(zhì)特征輸入分類器進行診斷。前端法側(cè)重于在特征選擇之前對樣本先進行預(yù)處理,后端法關(guān)注于特征選擇算法本身的改進。在特征選擇之前對樣本先進行預(yù)處理,可以解決特征選擇算法內(nèi)部無法提升的瓶頸問題。遺憾的是,現(xiàn)有的預(yù)處理方法針對的是原樣本個體本身,無論是樣本選擇、生成都不可避免改變了原樣本分布,因此處于樣本分布扭曲與質(zhì)量提升困難的兩難困境。


技術(shù)實現(xiàn)思路

1、本發(fā)明提供基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理及應(yīng)用方法,解決的技術(shù)問題在于:現(xiàn)有特征選擇前端的pd語音樣本預(yù)處理方法,針對的是原樣本個體本身,樣本分布扭曲,質(zhì)量提升困難。

2、為解決以上技術(shù)問題,本發(fā)明提供基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理方法,包括步驟:

3、s1、針對不同的pd語音數(shù)據(jù)集的每個原始樣本,自適應(yīng)確定最優(yōu)的近鄰樣本數(shù)量,基于每個原始樣本的近鄰樣本數(shù)量構(gòu)建其近鄰樣本包絡(luò);

4、s2、對每個近鄰樣本包絡(luò)進行轉(zhuǎn)置投影,提取樣本主成分,構(gòu)建對應(yīng)的近鄰包絡(luò)樣本;

5、s3、構(gòu)建分級雙層樣本模型,融合原始樣本和近鄰包絡(luò)樣本用于后續(xù)特征選擇。

6、進一步地,步驟s1具體包括步驟:

7、s11、對每個pd語音數(shù)據(jù)集,定義加權(quán)鄰域圖g=(v,e),g的頂點集v中的各個頂點對應(yīng)pd語音數(shù)據(jù)集中的各個原始樣本,g的邊集e中的各條邊對應(yīng)各個頂點與其k個最近鄰樣本的連線,各邊上的權(quán)重為對應(yīng)樣本與樣本間的歐式距離;

8、s12、計算加權(quán)鄰域圖g的最短距離矩陣和最短路徑矩陣;

9、s13、根據(jù)加權(quán)鄰域圖g的最短距離矩陣和最短路徑矩陣,為每個原始樣本尋找k個最近鄰樣本,將每個原始樣本與其k個最近鄰樣本通過包絡(luò)學(xué)習(xí)機制生成樣本包絡(luò),構(gòu)造出近鄰樣本包絡(luò)集。

10、進一步地,所述步驟s12具體包括步驟:

11、基于加權(quán)鄰域圖g求出其對應(yīng)的帶權(quán)鄰接矩陣a,將帶權(quán)鄰接矩陣a作為距離矩陣d(0)的初值,同時初始化最短路徑矩陣ω(0);

12、在距離矩陣d(0)中插入頂點集v中的第一個頂點x1構(gòu)造出距離矩陣d(1),d(1)的第i行第j列的元素是從xi到xj中間點只允許為x1路徑中的最短路徑距離,同時更新最短路徑矩陣為ω(1);

13、在距離矩陣d(1)中插入頂點集v中的第二個頂點x2構(gòu)造出距離矩陣d(2),d(2)的第i行第j列的元素是從xi到xj中間點只允許為x1、x2路徑中的最短路徑距離,同時更新最短路徑矩陣為ω(2);

14、以此類推,在距離矩陣中迭代插入頂點,直至經(jīng)過h次迭代后最后得到的距離矩陣d(h)作為圖g的最短距離矩陣,同時求出最短路徑矩陣ω(2)得到加權(quán)鄰域圖g中任意兩個樣本之間的最短路徑,此時距離矩陣d(h)的第i行第j列的元素為樣本間的最短路徑距離。

15、進一步地,在步驟s13中,采用網(wǎng)格搜索策略,通過對比不同近鄰數(shù)量下生成的包絡(luò)樣本在pd語音分類任務(wù)中的表現(xiàn),選擇使分類性能最優(yōu)的近鄰數(shù)量和對應(yīng)的近鄰樣本集。

16、進一步地,步驟s2包括具體包括步驟:

17、s21、將每個原始樣本的近鄰樣本包絡(luò)進行轉(zhuǎn)置,得到對應(yīng)的轉(zhuǎn)置樣本包絡(luò);

18、s22、將所有轉(zhuǎn)置樣本包絡(luò)按列合并得到樣本包絡(luò)矩陣;

19、s23、將樣本包絡(luò)矩陣歸一化后再利用投影向量進行投影得到對應(yīng)的投影包絡(luò)樣本集;

20、s24、將投影包絡(luò)樣本集中的每個投影包絡(luò)樣本進行逆轉(zhuǎn)置得到每個原始樣本所對應(yīng)的近鄰包絡(luò)樣本。

21、進一步地,在步驟s23中,通過最小化投影誤差構(gòu)建一個目標函數(shù),得到最佳的投影向量。

22、進一步地,對所述目標函數(shù)的優(yōu)化過程為:

23、將目標函數(shù)展開為固定值和非固定值組合的形式;

24、通過拉格朗日乘數(shù)法優(yōu)化非固定值,得到新的目標函數(shù);

25、令新的目標函數(shù)對投影向量的一階偏導(dǎo)數(shù)為零,求解最小解得到一個方程式;

26、求解該方程式,將特征分解后的最大特征值所對應(yīng)的特征向量作為投影向量。

27、本發(fā)明還提供一種基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本應(yīng)用方法,其關(guān)鍵在于,包括步驟:

28、s4、對原始樣本集及其近鄰包絡(luò)樣本集并行地進行特征學(xué)習(xí)和分類器訓(xùn)練,得到分級雙層類別標簽進行融合,得到最終的分類預(yù)測結(jié)果。

29、進一步地,步驟s4包括步驟:

30、s41、原始樣本集及其近鄰包絡(luò)樣本集并行輸送到各自的特征選擇模塊篩選出對應(yīng)的原始優(yōu)質(zhì)特征樣本集和近鄰優(yōu)質(zhì)包絡(luò)樣本集;

31、s42、采用原始優(yōu)質(zhì)特征樣本集和近鄰優(yōu)質(zhì)包絡(luò)樣本集分別訓(xùn)練一個基分類器;

32、s43、采用測試集對訓(xùn)練后的兩個基分類器進行測試得到兩個預(yù)測標簽向量;

33、s44、通過稀疏權(quán)重融合機制融合兩個預(yù)測標簽向量得到最終的預(yù)測標簽。

34、進一步地,在步驟s44中,稀疏權(quán)重融合機制的目標函數(shù)構(gòu)建為y=θ(lωt),y表示輸出的分類標簽,ω表示權(quán)重向量,l為預(yù)測標簽矩陣,預(yù)測標簽矩陣l的第1列為基于特征選擇降維后的近鄰包絡(luò)樣本集分類預(yù)測后的預(yù)測標簽向量,第2列為基于原始語音特征樣本集分類預(yù)測后的預(yù)測標簽向量,θ()表示根據(jù)lωt的值輸出0或1的0-1函數(shù)。

35、本發(fā)明提供的基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理及應(yīng)用方法,處理方法首先針對不同的pd語音數(shù)據(jù)集,自適應(yīng)確定最優(yōu)的近鄰樣本數(shù)量,并構(gòu)建近鄰樣本包絡(luò);然后對每個近鄰樣本包絡(luò)進行轉(zhuǎn)置投影,提取樣本主成分,構(gòu)建近鄰包絡(luò)樣本;最后構(gòu)建分級雙層樣本模型,融合原始樣本和近鄰包絡(luò)樣本用于后續(xù)特征選擇。應(yīng)用方法對原始樣本集及其近鄰包絡(luò)樣本集并行地進行特征學(xué)習(xí)和分類器訓(xùn)練,得到分級雙層類別標簽進行融合,得到最終的分類預(yù)測結(jié)果。應(yīng)用該語音樣本處理方法,多個pd語音特征選擇算法的準確率均取得了顯著提升。與近三年來的帕金森病語音診斷算法相比,傳統(tǒng)特征選擇分類算法引入本文提出的語音樣本處理方法后,在多個性能指標上均表現(xiàn)出最優(yōu)的效果。



技術(shù)特征:

1.基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理方法,其特征在于,包括步驟:

2.根據(jù)權(quán)利要求1所述的基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理方法,其特征在于,步驟s1具體包括步驟:

3.根據(jù)權(quán)利要求2所述的基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理方法,其特征在于,步驟s12具體包括步驟:

4.根據(jù)權(quán)利要求2所述的基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理方法,其特征在于:在步驟s13中,采用網(wǎng)格搜索策略,通過對比不同近鄰數(shù)量下生成的包絡(luò)樣本在pd語音分類任務(wù)中的表現(xiàn),選擇使分類性能最優(yōu)的近鄰數(shù)量和對應(yīng)的近鄰樣本集。

5.根據(jù)權(quán)利要求1至4任一項所述的基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理方法,其特征在于,步驟s2包括具體包括步驟:

6.根據(jù)權(quán)利要求5所述的基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理方法,其特征在于:在步驟s23中,通過最小化投影誤差構(gòu)建一個目標函數(shù),得到最佳的投影向量。

7.根據(jù)權(quán)利要求6所述的基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本處理方法,其特征在于,對所述目標函數(shù)的優(yōu)化過程為:

8.基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本應(yīng)用方法,其特征在于,包括步驟:

9.根據(jù)權(quán)利要求8所述的基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本應(yīng)用方法,其特征在于,步驟s4包括步驟:

10.根據(jù)權(quán)利要求9所述的基于流形近鄰包絡(luò)轉(zhuǎn)置投影的pd語音樣本應(yīng)用方法,其特征在于:在步驟s44中,稀疏權(quán)重融合機制的目標函數(shù)構(gòu)建為y=θ(lωt),y表示輸出的分類標簽,ω表示權(quán)重向量,l為預(yù)測標簽矩陣,預(yù)測標簽矩陣l的第1列為基于特征選擇降維后的近鄰包絡(luò)樣本集分類預(yù)測后的預(yù)測標簽向量,第2列為基于原始語音特征樣本集分類預(yù)測后的預(yù)測標簽向量,θ()表示根據(jù)lωt的值輸出0或1的0-1函數(shù)。


技術(shù)總結(jié)
本發(fā)明涉及帕金森病(PD)語音智能診斷技術(shù)領(lǐng)域,具體公開了基于流形近鄰包絡(luò)轉(zhuǎn)置投影的PD語音樣本處理及應(yīng)用方法,處理方法首先針對不同的PD語音數(shù)據(jù)集,自適應(yīng)確定最優(yōu)的近鄰樣本數(shù)量,并構(gòu)建近鄰樣本包絡(luò);然后對每個近鄰樣本包絡(luò)進行轉(zhuǎn)置投影,提取樣本主成分,構(gòu)建近鄰包絡(luò)樣本;最后構(gòu)建分級雙層樣本模型,融合原始樣本和近鄰包絡(luò)樣本用于后續(xù)特征選擇。應(yīng)用方法對原始樣本集及其近鄰包絡(luò)樣本集并行地進行特征學(xué)習(xí)和分類器訓(xùn)練,得到分級雙層類別標簽進行融合,得到最終的分類預(yù)測結(jié)果。應(yīng)用該語音樣本處理方法,多個PD語音特征選擇算法的準確率均取得了顯著提升。

技術(shù)研發(fā)人員:王俊杰,陳紅,李勇明,王維,王品,顏芳
受保護的技術(shù)使用者:重慶大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2025/7/28
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1