用于巡航導(dǎo)彈突防航跡規(guī)劃的改進深度強化學習算法
所屬分類:技術(shù)論文
上傳者:aetmagazine
文檔大小:609 K
標簽: 巡航導(dǎo)彈 DDPG算法 突防策略
所需積分:0分積分不夠怎么辦?
文檔介紹:為了解決巡航導(dǎo)彈面臨動態(tài)預(yù)警機雷達威脅下的突防航跡規(guī)劃問題,提出一種改進深度強化學習智能航跡規(guī)劃方法。針對巡航導(dǎo)彈面對預(yù)警威脅的突防任務(wù),構(gòu)建了典型的作戰(zhàn)場景,給出了預(yù)警機雷達探測概率的預(yù)測公式,在此基礎(chǔ)上設(shè)計了一種引入動態(tài)預(yù)警威脅的獎勵函數(shù),使用深度確定性策略梯度網(wǎng)絡(luò)算法(Deep Deterministic Policy Gradient,DDPG)探究巡航導(dǎo)彈智能突防問題。針對傳統(tǒng)DDPG算法中探索噪聲時序不相關(guān)探索能力差的問題,引入了奧恩斯坦-烏倫貝克噪聲,提高了算法的訓(xùn)練效率。計算結(jié)果表明,改進的DDPG算法訓(xùn)練收斂時間更短。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。