基于模仿學(xué)習(xí)和強化學(xué)習(xí)的啟發(fā)式多智能體路徑規(guī)劃 | |
所屬分類:技術(shù)論文 | |
上傳者:wwei | |
文檔大?。?span>1703 K | |
標(biāo)簽: 多智能體路徑規(guī)劃 強化學(xué)習(xí) 模仿學(xué)習(xí) | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:多智能體路徑規(guī)劃(Multi-Agent Path Finding, MAPF)擴展到大型動態(tài)環(huán)境中是一個越來越有挑戰(zhàn)的問題?,F(xiàn)實世界中,環(huán)境動態(tài)變化往往需要實時重新規(guī)劃路徑。在部分可觀察環(huán)境中,使用強化學(xué)習(xí)方法學(xué)習(xí)分散的策略解決MAPF問題表現(xiàn)出較大潛力。針對智能體之間如何學(xué)會合作和環(huán)境獎勵稀疏問題,提出基于模仿學(xué)習(xí)和強化學(xué)習(xí)的啟發(fā)式多智能體路徑規(guī)劃算法。實驗表明,該方法在高密度障礙環(huán)境中具有較好的性能和擴展性。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2