注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)人工智能深度強(qiáng)化學(xué)習(xí)理論與實踐

深度強(qiáng)化學(xué)習(xí)理論與實踐

深度強(qiáng)化學(xué)習(xí)理論與實踐

定 價:¥89.00

作 者: 龍強(qiáng),章勝
出版社: 清華大學(xué)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787302625544 出版時間: 2023-03-01 包裝: 平裝
開本: 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書比較全面、系統(tǒng)地介紹了深度強(qiáng)化學(xué)習(xí)的理論和算法,并配有大量的案例和編程實現(xiàn)。全書核心內(nèi)容可以分為3部分,第一部分為經(jīng)典強(qiáng)化學(xué)習(xí),包括第2、3、4章,主要內(nèi)容有動態(tài)規(guī)劃法,蒙特卡洛法、時序差分法;第二部分為深度強(qiáng)化學(xué)習(xí),包括第6、7、8章,主要內(nèi)容有值函數(shù)近似法、策略梯度法、策略梯度法進(jìn)階;第三部分重點介紹了深度強(qiáng)化學(xué)習(xí)的經(jīng)典應(yīng)用——AlphaGo系列算法。另外,作為理論和算法的輔助,第1章介紹了強(qiáng)化學(xué)習(xí)的模型,第5章簡單介紹了深度學(xué)習(xí)和PyTorch編程框架。 本書可以作為理工科大學(xué)相關(guān)專業(yè)研究生的學(xué)位課教材,也可以作為人工智能、機(jī)器學(xué)習(xí)相關(guān)專業(yè)高年級本科生的選修課教材,還可以作為相關(guān)領(lǐng)域?qū)W術(shù)研究人員、教師和工程技術(shù)人員的參考資料。

作者簡介

暫缺《深度強(qiáng)化學(xué)習(xí)理論與實踐》作者簡介

圖書目錄

暫缺《深度強(qiáng)化學(xué)習(xí)理論與實踐》目錄

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號