本發(fā)明涉及氫燃料電池長續(xù)航無人機能量管理與軌跡跟蹤控制領(lǐng)域,具體的說是一種氫燃料電池?zé)o人機能量管理與軌跡跟蹤協(xié)同控制方法。
背景技術(shù):
1、長續(xù)航無人機可單次完成數(shù)十公里鐵路線路的無間斷巡查,避免傳統(tǒng)分段式人工巡檢導(dǎo)致的盲區(qū),是提升隱患發(fā)現(xiàn)效率的重要手段。鐵路線路常穿越山區(qū)、隧道、橋梁等高風(fēng)險區(qū)域,無人機需持續(xù)應(yīng)對強風(fēng)、低溫等干擾,高續(xù)航機型可保障在惡劣天氣下完成關(guān)鍵任務(wù)。氫燃料電池抗低溫性能突出,能量密度氫燃料電池能量密度可達鋰電池的幾倍甚至上百倍,可顯著擴大單架次巡檢范圍。氫燃料電池混合電源系統(tǒng)能量管理是提高動力系統(tǒng)續(xù)航能力的核心技術(shù)之一。面向鐵路巡檢的氫燃料電池長續(xù)航無人機能量管理與軌跡跟蹤協(xié)同控制策略研究,從整機層面對系統(tǒng)進行能源統(tǒng)籌管理成為氫燃料電池?zé)o人機未來的發(fā)展趨勢。
2、氫燃料電池?zé)o人機在飛行過程中,存在不可預(yù)知的干擾,無人機數(shù)學(xué)模型與實機存在一定誤差。在實際飛行過程中,為了保證無人機按照期望預(yù)定軌跡飛行,需要引入控制方法保證軌跡跟蹤的精確和準確性。同時,在無人機執(zhí)行急轉(zhuǎn)彎、避障等復(fù)雜軌跡跟蹤任務(wù)時,功率需求突變易導(dǎo)致供電系統(tǒng)瞬時超載,引發(fā)軌跡偏差,如何讓能量管理系統(tǒng)實時預(yù)測軌跡控制指令的功率需求,并動態(tài)調(diào)整氫燃料電池與儲能裝置的協(xié)同輸出是個挑戰(zhàn)。
技術(shù)實現(xiàn)思路
1、本發(fā)明旨在提供氫燃料電池?zé)o人機能量管理與軌跡跟蹤協(xié)同控制方法。通過研究外部擾動和模型不確定性的影響,引入固定時間控制和自抗擾控制原理,設(shè)計基于固定時間自抗擾控制的雙閉環(huán)無人機軌跡跟蹤方法,獲取時域內(nèi)有效的無人機工況需求信息與動力控制輸出;基于軌跡跟蹤控制的產(chǎn)生的需求信息,綜合考慮氫燃料電池溫差、鋰電池soc維持、氫燃料消耗及能量源使用壽命等因素,建立壽命衰減成本函數(shù)和基于等效燃料消耗最小的能耗成本函數(shù),設(shè)計融合軌跡跟蹤控制的智能能量管理協(xié)同控制方法,降低氫氣消耗,提高整機的續(xù)航能力。
2、為了解決以上技術(shù)問題,本發(fā)明給出一種氫燃料電池?zé)o人機能量管理與軌跡跟蹤協(xié)同控制方法,包括以下步驟:
3、s1,構(gòu)建無人機動力學(xué)模型,根據(jù)固定時間控制原理和自抗擾控制原理,設(shè)計基于固定時間自抗擾控制的雙閉環(huán)無人機軌跡跟蹤方法,獲取時域內(nèi)有效的無人機工況需求信息與動力控制輸出;
4、s2,設(shè)計基于軌跡跟蹤控制的混合電源系統(tǒng)智能能量管理框架,構(gòu)建融合了基于歷史數(shù)據(jù)時序負載工況預(yù)測和軌跡跟蹤運動控制信息的無人機負載工況融合預(yù)測模型,基于氫燃料電池溫差、鋰電池soc維持、氫燃料消耗及能量源使用壽命因素,建立壽命衰減成本函數(shù)和基于等效燃料消耗最小的能耗成本函數(shù)。
5、進一步的,所述s1包括:
6、s1-1,分析氫燃料電池混合系統(tǒng)的典型工作模式和不同模式下的能量特性,基于運動學(xué)和動力學(xué)方法,構(gòu)建所述氫燃料電池混合系統(tǒng)的動力學(xué)模型;
7、s1-2,采用所述基于固定時間自抗擾控制的雙閉環(huán)無人機軌跡跟蹤方法跟蹤目標軌跡。
8、進一步的,所述s1-1包括:
9、所述氫燃料電池混合系統(tǒng)是以氫燃料電池為主能量源,以鋰電池為輔助能量源的并聯(lián)混合電源系統(tǒng),所述氫燃料電池通過升壓變換器連接到母線,所述鋰電池的輸出直接連接到母線,所述氫燃料電池混合系統(tǒng)的能量方程如下:
10、pfcη+pb=pd+pae
11、其中,pfc為所述氫燃料電池輸出功率,η為所述氫燃料電池的效率,pb為所述鋰電池的輸出功率、pd為電推系統(tǒng)消耗功率,pae為輔助設(shè)備消耗功率。
12、進一步的,所述s1-2中,基于固定時間自抗擾控制的雙閉環(huán)無人機軌跡跟蹤方法的構(gòu)建過程為:
13、首先,設(shè)計基于狀態(tài)觀測器的固定時間無人機位置跟蹤控制器,所述無人機的軌跡跟蹤運動控制包括外環(huán)與內(nèi)環(huán)兩個閉環(huán),所述外環(huán)采用模型預(yù)測控制和擴張狀態(tài)觀測器相結(jié)合的位置跟蹤控制,所述內(nèi)環(huán)采用自抗擾控制器,所述無人機動力學(xué)模型的位置跟蹤控制如下:
14、
15、其中,分別表示x,y,z方向加速度;kdx,kdy,kdz分別表示x,y,z方向上的增益系數(shù);ux,uy,uz分別表示x,y,z方向控制器的輸入,dx,dy,dz分別表示x,y,z方向上的擾動,m表示無人機的質(zhì)量,表示x方向的速度,表示y方向的速度,表示z方向的速度;
16、其次,將自抗擾控制策略作為所述無人機在擾動環(huán)境下實現(xiàn)姿態(tài)追蹤的手段,所述自抗擾控制策略包括跟蹤微分器、擴張狀態(tài)觀測器及誤差補償控制器:所述跟蹤微分器負責(zé)提取參考軌跡的微分信息,所述擴張狀態(tài)觀測器用于估計并削弱外部干擾的影響,并以固定時間控制器替代非線性誤差反饋機制;
17、最后,基于所述無人機動力學(xué)模型的位置跟蹤控制得出的參考跟蹤值,并結(jié)合不等式放縮技術(shù)和柯西-施瓦茨不等式技術(shù),設(shè)計固定時間自抗擾控制并使所述固定時間自抗擾控制滿足李亞普諾夫固定時間引理
18、進一步的,所述s2包括:
19、s2-1,根據(jù)氫燃料消耗、鋰電池soc以及氫燃料電池耐久性設(shè)定優(yōu)化目標函數(shù),將功率輸出設(shè)為動作,將負載狀態(tài)與鋰電池soc設(shè)為狀態(tài),構(gòu)建智能能量管理空間;
20、s2-2,引入基于q網(wǎng)絡(luò)的獎勵機制模型,設(shè)計損失函數(shù)指導(dǎo)所述基于q網(wǎng)絡(luò)的獎勵機制模型的學(xué)習(xí)方向,設(shè)計狀態(tài)轉(zhuǎn)移函數(shù)用于使所述智能能量管理空間理解環(huán)境的動態(tài)行為。
21、進一步的,所述s2-1包括:
22、首先,根據(jù)所述基于固定時間自抗擾控制的雙閉環(huán)無人機軌跡跟蹤方法確定功率需求數(shù)據(jù),采用dyna算法與dqn算法相結(jié)合的強化學(xué)習(xí)方法,優(yōu)化所述混合電源系統(tǒng)智能能量管理框架,所述混合電源系統(tǒng)智能能量管理框架包含離線學(xué)習(xí)階段與在線學(xué)習(xí)階段,在所述離線學(xué)習(xí)階段,利用所述無人機的典型負載工況數(shù)據(jù)訓(xùn)練門控循環(huán)單元模型,使所述混合電源系統(tǒng)智能能量管理框架學(xué)習(xí)環(huán)境和工況特征;在所述在線學(xué)習(xí)階段,所述混合電源系統(tǒng)智能能量管理框架通過所述基于固定時間自抗擾控制的雙閉環(huán)無人機軌跡跟蹤方法持續(xù)積累與環(huán)境的交互經(jīng)驗從而實時更新所述強化學(xué)習(xí)方法的強化學(xué)習(xí)模型,進而持續(xù)減少所述強化學(xué)習(xí)模型在運行中的累積誤差;
23、其次,所述智能能量管理空間如下:
24、
25、
26、式中:rd表示異常狀態(tài)負常數(shù),s表示狀態(tài)空間,s表示狀態(tài)序列,a表示動作空間,a表示動作序列,pfc為所述氫燃料電池輸出功率,r表示獎勵函數(shù),r(s,a)表示獎勵值空間,pload(k)表示k時刻的需求功率,soc(k)表示k時刻的鋰電池荷電狀態(tài),soc(k)t表示k時刻鋰電池荷電狀態(tài)的轉(zhuǎn)置,mh2(k)表示k時刻氫消耗質(zhì)量,socref(k)表示k時刻的鋰電池參考荷電狀態(tài),ifc(k)表示k時刻燃料電池輸出電流,rk,ξ1,ξ2分別表示氫消耗質(zhì)量系數(shù),鋰電池電池荷電狀態(tài)差系數(shù),燃料電池輸出電流系數(shù)。
27、進一步的,所述s2-2包括:
28、首先,建立環(huán)境模型,所述環(huán)境模型包括所述混合電源系統(tǒng)智能能量管理框架中的狀態(tài)轉(zhuǎn)移函數(shù)和損失函數(shù),所述損失函數(shù)如下:
29、
30、其中,loss(θi)表示損失函數(shù),qrt(s(k),a(k),θi)表示目標網(wǎng)絡(luò)回報函數(shù)qre(s(k),a(k),θi)表示評估網(wǎng)絡(luò)回報函數(shù);q*(s(k),a(k),θi)為最優(yōu)動作值函數(shù),q(s(k),a(k),θi)表示動作值函數(shù),ε-greedy為貪婪策略函數(shù);θi為迭代次數(shù)i時的參數(shù),s(k)表示k時刻狀態(tài),a(k)表示k時刻動作,s(k+1)表示k+1時刻狀態(tài),a(k+1)表示k+1時刻動作;
31、其次,利用所述無人機負載工況融合預(yù)測模型來定義所述狀態(tài)轉(zhuǎn)移函數(shù),所述狀態(tài)轉(zhuǎn)移函數(shù)用于根據(jù)當前的負載狀況、氫燃料電池的輸出功率以及所述無人機負載工況融合預(yù)測模型的參數(shù),計算所述氫燃料電池混合系統(tǒng)中所述鋰電池的未來荷電狀態(tài)。
32、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
33、設(shè)計一種固定時間自抗擾控制器跟蹤目標軌跡,使得軌跡跟蹤更加精準快速,抗干擾能力強,能夠獲得更加合理的功率需求信息。然后利用獲得的功率需求信息,綜合考慮氫燃料電池溫差、鋰電池soc維持、氫燃料消耗及能量源使用壽命等因素,建立壽命衰減成本函數(shù)和基于等效燃料消耗最小能耗成本函數(shù),設(shè)計融合軌跡跟蹤控制智能能量管理協(xié)同控制方法,使得氫氣消耗更少,續(xù)航能力更強。