當(dāng)前位置:首頁 > 科技文檔 > 自動化技術(shù) > 正文

多智能體強化學(xué)習(xí)理論及其應(yīng)用綜述

模式識別與人工智能 頁數(shù): 22 2024-10-15
摘要: 強化學(xué)習(xí)是一種用于解決序列決策問題的常用機器學(xué)習(xí)方法,核心思想是讓智能體與環(huán)境交互獲得反饋,從而逐步學(xué)會最佳策略.隨著實際應(yīng)用對計算能力和數(shù)據(jù)規(guī)模的要求不斷提高,單體智能轉(zhuǎn)向群體智能逐漸成為人工智能未來發(fā)展的必然趨勢,這為強化學(xué)習(xí)帶來諸多新的機遇和挑戰(zhàn).文中首先從深度多智能體強化學(xué)習(xí)概念著手,針對目前的理論困境,如可拓展性較差、效用分配較難、探索-利用困境、環(huán)境非穩(wěn)態(tài)、信息部分... (共22頁)

開通會員,享受整站包年服務(wù)