用于巡航導(dǎo)彈突防航跡規(guī)劃的改進深度強化學習算法 | |
所屬分類:技術(shù)論文 | |
上傳者:aetmagazine | |
文檔大小:609 K | |
標簽: 巡航導(dǎo)彈 DDPG算法 突防策略 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:為了解決巡航導(dǎo)彈面臨動態(tài)預(yù)警機雷達威脅下的突防航跡規(guī)劃問題,提出一種改進深度強化學習智能航跡規(guī)劃方法。針對巡航導(dǎo)彈面對預(yù)警威脅的突防任務(wù),構(gòu)建了典型的作戰(zhàn)場景,給出了預(yù)警機雷達探測概率的預(yù)測公式,在此基礎(chǔ)上設(shè)計了一種引入動態(tài)預(yù)警威脅的獎勵函數(shù),使用深度確定性策略梯度網(wǎng)絡(luò)算法(Deep Deterministic Policy Gradient,DDPG)探究巡航導(dǎo)彈智能突防問題。針對傳統(tǒng)DDPG算法中探索噪聲時序不相關(guān)探索能力差的問題,引入了奧恩斯坦-烏倫貝克噪聲,提高了算法的訓(xùn)練效率。計算結(jié)果表明,改進的DDPG算法訓(xùn)練收斂時間更短。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2