基于深度強化學(xué)習(xí)和社會力模型的移動機器人自主避障 | |
所屬分類:技術(shù)論文 | |
上傳者:zhoubin333 | |
文檔大?。?span>1912 K | |
標(biāo)簽: 深度強化學(xué)習(xí) 社會力模型 自主避障 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:深度強化學(xué)習(xí)在移動機器人自主避障領(lǐng)域已得到廣泛應(yīng)用,其基本原理是通過模擬環(huán)境中的不斷試錯,結(jié)合獎勵機制提升機器人的避障性能。然而,針對不同任務(wù)場景,網(wǎng)絡(luò)訓(xùn)練效率存在顯著差異。同時,在人群密集的場景中,機器人的行為可能對人類造成干擾。為了應(yīng)對訓(xùn)練效率低下和機器人行為不符合社會規(guī)范的問題,提出了一種將社會力模型融入深度強化學(xué)習(xí)的自主避障策略。該策略首先將人類未來的運動軌跡考慮進獎勵函數(shù),以確保機器人理解人類意圖并避免闖入人類的舒適區(qū)。其次,在訓(xùn)練過程中引入先驗的傳統(tǒng)控制器模型,并設(shè)計了一種基于概率的切換開關(guān),以隨機切換控制器輸出,提高機器人的探索效率。實驗結(jié)果表明,所提出的方法能夠增加機器人與人類之間的安全距離,同時實現(xiàn)平穩(wěn)導(dǎo)航。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2