基于模仿學(xué)習(xí)和強化學(xué)習(xí)的啟發(fā)式多智能體路徑規(guī)劃
所屬分類:技術(shù)論文
上傳者:wwei
文檔大?。?span>1703 K
標(biāo)簽: 多智能體路徑規(guī)劃 強化學(xué)習(xí) 模仿學(xué)習(xí)
所需積分:0分積分不夠怎么辦?
文檔介紹:多智能體路徑規(guī)劃(Multi-Agent Path Finding, MAPF)擴展到大型動態(tài)環(huán)境中是一個越來越有挑戰(zhàn)的問題?,F(xiàn)實世界中,環(huán)境動態(tài)變化往往需要實時重新規(guī)劃路徑。在部分可觀察環(huán)境中,使用強化學(xué)習(xí)方法學(xué)習(xí)分散的策略解決MAPF問題表現(xiàn)出較大潛力。針對智能體之間如何學(xué)會合作和環(huán)境獎勵稀疏問題,提出基于模仿學(xué)習(xí)和強化學(xué)習(xí)的啟發(fā)式多智能體路徑規(guī)劃算法。實驗表明,該方法在高密度障礙環(huán)境中具有較好的性能和擴展性。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。