當(dāng)前位置:首頁 > 科技文檔 > 自動化技術(shù) > 正文

自注意力機制結(jié)合DDPG的機器人路徑規(guī)劃研究

計算機工程與應(yīng)用 頁數(shù): 9 2023-09-21
摘要: 為更好解決深度確定性策略梯度算法在路徑規(guī)劃中存在樣本利用率低、獎勵稀疏、網(wǎng)絡(luò)模型穩(wěn)定速度慢等問題,提出了一種改進(jìn)DDPG的算法。通過對機器人相機傳感器獲取圖片信息加入自注意力機制,利用Dotproduct方法計算圖片之間的相關(guān)性,能夠?qū)⑤^高權(quán)重精確聚焦在障礙物信息中。在復(fù)雜環(huán)境中,由于機器人缺乏經(jīng)驗導(dǎo)致難以獲得正反饋的獎勵,影響了機器人的探索能力。將DDPG算法與HER結(jié)合,提... (共9頁)

開通會員,享受整站包年服務(wù)