中文字幕s级优女区,欧美人人草,色综合九九,伊香蕉大综综综合久久,久久99精品久久久久久牛牛影视,国产成人综合久久,中文久草

一種基于代謝組學的煙葉生態(tài)區(qū)分類方法、裝置及介質與流程

文檔序號:42591875發(fā)布日期:2025-07-29 17:44閱讀:11來源:國知局

本發(fā)明涉及煙葉生態(tài)區(qū)分類,?特別是涉及一種基于代謝組學的煙葉生態(tài)區(qū)分類方法、裝置及介質。


背景技術:

1、在煙草行業(yè)中,煙葉的生態(tài)區(qū)分類對煙草品質控制、產品標準化及市場價值評估具有重要意義。不同生態(tài)區(qū)的氣候條件、土壤特性以及海拔高度等環(huán)境因素,會直接影響煙葉的生理代謝過程,導致其化學成分和物理特性產生顯著差異。這些差異最終體現(xiàn)在煙葉的燃燒特性、香氣風格和感官品質上,進而決定了其工業(yè)可用性和商業(yè)價值。因此,建立科學、精準的煙葉生態(tài)區(qū)分類體系,是提升煙草制品品質穩(wěn)定性、保障品牌特色和實現(xiàn)優(yōu)質優(yōu)價的重要前提。

2、然而,傳統(tǒng)煙葉生態(tài)區(qū)分類方法主要依賴于人工經驗判斷或簡單的理化指標檢測,不僅依賴評煙師的主觀判斷,易受個體差異和外部因素干擾,且僅關注如煙堿、總糖等少數(shù)已知成分,導致分類結果的一致性、準確性都比較差。


技術實現(xiàn)思路

1、基于此,有必要針對上述技術問題,提供一種系統(tǒng)化、高精度的煙葉生態(tài)區(qū)分類方法、裝置及計算機可讀存儲介質。

2、第一方面,本申請?zhí)峁┝艘环N基于代謝組學的煙葉生態(tài)區(qū)分類方法,包括:

3、獲取煙葉樣本集的代謝物數(shù)據(jù)集;所述煙葉樣本集包括各生態(tài)區(qū)的多個煙葉樣本,以及對應的生態(tài)區(qū)標識;

4、對所述代謝物數(shù)據(jù)集進行數(shù)據(jù)預處理,得到樣本特征集;使用多種特征選擇方法分別從所述樣本特征集中選擇若干最優(yōu)特征,構成最優(yōu)特征數(shù)據(jù)集;

5、利用所述最優(yōu)特征數(shù)據(jù)集對多個分類算法模型分別進行訓練及融合,得到訓練完成的煙葉生態(tài)區(qū)融合分類模型;

6、對待分類煙葉獲取所述若干最優(yōu)特征,輸入至所述訓練完成的煙葉生態(tài)區(qū)融合分類模型,得到生態(tài)區(qū)預測結果。

7、在其中一些實施例中,所述利用所述最優(yōu)特征數(shù)據(jù)集對多個分類算法模型分別進行訓練及融合,得到訓練完成的煙葉生態(tài)區(qū)融合分類模型包括:

8、選擇多個分類算法模型,并設置各所述分類算法模型的超參數(shù);

9、使用所述最優(yōu)特征數(shù)據(jù)集分別訓練所述多個分類算法模型;

10、使用模型融合方法對訓練完成的所述多個分類算法模型進行融合,得到融合后的煙葉生態(tài)區(qū)融合分類模型。

11、在其中一些實施例中,所述使用模型融合方法對訓練完成的所述多個分類算法模型進行融合,得到融合后的煙葉生態(tài)區(qū)融合分類模型包括:

12、獲取所述多個分類算法模型對所述最優(yōu)特征數(shù)據(jù)集的類別預測結果;

13、統(tǒng)計每種所述類別預測結果被預測為最終類別的票數(shù);

14、將獲得最高票數(shù)的類別預測結果確定為所述最優(yōu)特征數(shù)據(jù)集的最終預測類別。

15、在其中一些實施例中,所述多個分類算法模型包括支持向量機svm模型、隨機森林模型和多層感知機mlp模型中的至少兩個。

16、在其中一些實施例中,所述使用多種特征選擇方法分別從所述樣本特征集中選擇若干最優(yōu)特征,構成最優(yōu)特征數(shù)據(jù)集包括:

17、計算所述樣本特征集的方差,選擇計算結果中方差最大的若干第一最優(yōu)特征;

18、通過皮爾森相關系數(shù)計算樣本特征集中各個樣本特征之間的線性相關程度,選擇若干第二最優(yōu)特征;

19、通過lightgbm算法對所述樣本特征集進行特征重要度計算,選擇重要度最高的若干第三最優(yōu)特征;

20、將第一最優(yōu)特征、第二最優(yōu)特征、第三最優(yōu)特征作并集,構成所述最優(yōu)特征數(shù)據(jù)集。

21、在其中一些實施例中,所述對所述煙葉生態(tài)區(qū)分類融合模型進行評估包括:

22、基于測試數(shù)據(jù)集對所述煙葉生態(tài)區(qū)分類融合模型進行預測,生成生態(tài)區(qū)預測結果;

23、計算所述生態(tài)區(qū)預測結果與真實生態(tài)區(qū)標識之間的評估指標,所述評估指標包括準確率、精確率、召回率或f1分數(shù)中的至少一種;

24、當所述評估指標未達到預設值時,調整所述多個分類算法模型的超參數(shù),并重新訓練所述多個分類算法模型;

25、重復以上步驟直至所述評估指標達到預設值或達到最大迭代次數(shù)。

26、在其中一些實施例中,所述對所述代謝物數(shù)據(jù)集進行數(shù)據(jù)預處理,得到樣本特征集包括:

27、對所述代謝物數(shù)據(jù)集進行數(shù)據(jù)清洗;

28、對數(shù)據(jù)清洗后的數(shù)據(jù)做數(shù)據(jù)歸一化處理,得到所述樣本特征集。

29、在其中一些實施例中,所述煙葉樣本集的代謝物數(shù)據(jù)集是通過gc-ms和lc-ms分析平臺對所述煙葉樣本集進行分析獲得的。

30、第二方面,本申請還提供了一種煙葉生態(tài)區(qū)分類裝置,所述裝置包括:

31、獲取模塊,用于獲取煙葉樣本的代謝物數(shù)據(jù)集;

32、特征篩選模塊,用于選擇若干最優(yōu)特征,構成最優(yōu)特征數(shù)據(jù)集;

33、訓練模塊,用于利用所述最優(yōu)特征數(shù)據(jù)集對多個分類算法模型分別進行訓練及融合,得到訓練完成的煙葉生態(tài)區(qū)融合分類模型;

34、識別模塊,用于對待分類煙葉獲取所述若干最優(yōu)特征,輸入至所述訓練完成的煙葉生態(tài)區(qū)融合分類模型,得到生態(tài)區(qū)預測結果。

35、第三方面,本申請還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)以下步驟:

36、獲取煙葉樣本集的代謝物數(shù)據(jù)集;所述煙葉樣本集包括各生態(tài)區(qū)的多個煙葉樣本,以及對應的生態(tài)區(qū)標識;

37、對所述代謝物數(shù)據(jù)集進行數(shù)據(jù)預處理,得到樣本特征集;使用多種特征選擇方法分別從所述樣本特征集中選擇若干最優(yōu)特征,構成最優(yōu)特征數(shù)據(jù)集;

38、利用所述最優(yōu)特征數(shù)據(jù)集對多個分類算法模型分別進行訓練及融合,得到訓練完成的煙葉生態(tài)區(qū)融合分類模型;

39、對待分類煙葉獲取所述若干最優(yōu)特征,輸入至所述訓練完成的煙葉生態(tài)區(qū)融合分類模型,得到生態(tài)區(qū)預測結果。

40、與相關技術相比,上述一種基于代謝組學的煙葉生態(tài)區(qū)分類方法、裝置及介質使用多種特征選擇方法分別從所述樣本特征集中選擇若干最優(yōu)特征,構成最優(yōu)特征數(shù)據(jù)集,可以從不同角度選擇有用的關鍵特征,同時達到了特征降維的目的。利用所述最優(yōu)特征數(shù)據(jù)集對多個分類算法模型分別進行訓練及融合,得到訓練完成的煙葉生態(tài)區(qū)融合分類模型,能夠通過不同原理的模型,針對性的對數(shù)據(jù)進行建模從而從不同角度提高分類能力。通過整合代謝組學分析、多維度特征篩選及多模型融合技術,該方法能夠顯著提升煙葉生態(tài)區(qū)分類的客觀性、準確性。



技術特征:

1.一種基于代謝組學的煙葉生態(tài)區(qū)分類方法,其特征在于,所述方法包括:

2.根據(jù)權利要求1所述的方法,其特征在于,所述利用所述最優(yōu)特征數(shù)據(jù)集對多個分類算法模型分別進行訓練及融合,得到訓練完成的煙葉生態(tài)區(qū)融合分類模型包括:

3.根據(jù)權利要求2所述的方法,其特征在于,所述使用模型融合方法對訓練完成的所述多個分類算法模型進行融合,得到融合后的煙葉生態(tài)區(qū)融合分類模型包括:

4.根據(jù)權利要求2所述的方法,其特征在于,所述多個分類算法模型包括支持向量機svm模型、隨機森林模型和多層感知機mlp模型中的至少兩個。

5.根據(jù)權利要求1所述的方法,其特征在于,所述使用多種特征選擇方法分別從所述樣本特征集中選擇若干最優(yōu)特征,構成最優(yōu)特征數(shù)據(jù)集包括:

6.根據(jù)權利要求1所述的方法,其特征在于,所述對所述煙葉生態(tài)區(qū)分類融合模型進行評估包括:

7.根據(jù)權利要求1所述的方法,其特征在于,所述對所述代謝物數(shù)據(jù)集進行數(shù)據(jù)預處理,得到樣本特征集包括:

8.根據(jù)權利要求1所述的方法,其特征在于,所述煙葉樣本集的代謝物數(shù)據(jù)集是通過gc-ms和lc-ms分析平臺對所述煙葉樣本集進行分析獲得的。

9.一種煙葉生態(tài)區(qū)分類裝置,其特征在于,所述裝置包括:

10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時,實現(xiàn)權利要求1至8中任一項所述的煙葉生態(tài)區(qū)分類方法的步驟。


技術總結
本申請涉及一種基于代謝組學的煙葉生態(tài)區(qū)分類方法、裝置及介質。所述方法包括:獲取煙葉樣本集的代謝物數(shù)據(jù)集;所述煙葉樣本集包括各生態(tài)區(qū)的多個煙葉樣本,以及對應的生態(tài)區(qū)標識;對所述代謝物數(shù)據(jù)集進行數(shù)據(jù)預處理,得到樣本特征集;使用多種特征選擇方法分別從所述樣本特征集中選擇若干最優(yōu)特征,構成最優(yōu)特征數(shù)據(jù)集;利用所述最優(yōu)特征數(shù)據(jù)集對多個分類算法模型分別進行訓練及融合,得到訓練完成的煙葉生態(tài)區(qū)融合分類模型;對待分類煙葉獲取所述若干最優(yōu)特征,輸入至所述訓練完成的煙葉生態(tài)區(qū)融合分類模型,得到生態(tài)區(qū)預測結果。本方法能實現(xiàn)煙葉生態(tài)區(qū)的精準自動化分類,解決了傳統(tǒng)方法依賴人工經驗、信息利用不足及模型泛化性差的技術難題。

技術研發(fā)人員:金慧清,郝賢偉,袁曉龍,袁凱龍,張鵬,廖付,李永生,潘力,趙振杰,趙程虹,趙攀攀,俞錁,張文敏,李奇,高麗偉,申民翀
受保護的技術使用者:浙江中煙工業(yè)有限責任公司
技術研發(fā)日:
技術公布日:2025/7/28
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1