深度強化學(xué)習(xí)理論與實踐

定　價：￥89.00

作　者：	龍強，章勝
出版社：	清華大學(xué)出版社
叢編項：
標(biāo)　簽：	暫缺

購買這本書可以去

當(dāng)當(dāng)網(wǎng) (￥66.70)

ISBN：	9787302625544	出版時間：	2023-03-01	包裝：	平裝
開本：		頁數(shù)：		字?jǐn)?shù)：

內(nèi)容簡介

　　本書比較全面、系統(tǒng)地介紹了深度強化學(xué)習(xí)的理論和算法，并配有大量的案例和編程實現(xiàn)。全書核心內(nèi)容可以分為3部分，第一部分為經(jīng)典強化學(xué)習(xí)，包括第2、3、4章，主要內(nèi)容有動態(tài)規(guī)劃法，蒙特卡洛法、時序差分法；第二部分為深度強化學(xué)習(xí)，包括第6、7、8章，主要內(nèi)容有值函數(shù)近似法、策略梯度法、策略梯度法進階；第三部分重點介紹了深度強化學(xué)習(xí)的經(jīng)典應(yīng)用——AlphaGo系列算法。另外，作為理論和算法的輔助，第1章介紹了強化學(xué)習(xí)的模型，第5章簡單介紹了深度學(xué)習(xí)和PyTorch編程框架。本書可以作為理工科大學(xué)相關(guān)專業(yè)研究生的學(xué)位課教材，也可以作為人工智能、機器學(xué)習(xí)相關(guān)專業(yè)高年級本科生的選修課教材，還可以作為相關(guān)領(lǐng)域?qū)W術(shù)研究人員、教師和工程技術(shù)人員的參考資料。