注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)人工智能Python深度強化學(xué)習(xí)入門:強化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制

Python深度強化學(xué)習(xí)入門:強化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制

Python深度強化學(xué)習(xí)入門:強化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制

定 價:¥89.00

作 者: (日)伊藤多一,今津義充,須藤廣大,仁平將人,川崎悠介 等
出版社: 機械工業(yè)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787111700722 出版時間: 2022-04-01 包裝:
開本: 16開 頁數(shù): 239 字?jǐn)?shù):  

內(nèi)容簡介

  《Python深度強化學(xué)習(xí)入門:強化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制》共7章。第1章介紹了機器學(xué)習(xí)的分類、強化學(xué)習(xí)的學(xué)習(xí)機制以及深度強化學(xué)習(xí)的概念;第2章通過強化學(xué)習(xí)的基本概念、馬爾可夫決策過程和貝爾曼方程、貝爾曼方程的求解方法、無模型控制等介紹了強化學(xué)習(xí)的基本算法;第3章通過深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)介紹了強化學(xué)習(xí)中深度學(xué)習(xí)的特征提取方法;第4章通過行動價值函數(shù)的網(wǎng)絡(luò)表示、策略函數(shù)的網(wǎng)絡(luò)表示介紹了深度強化學(xué)習(xí)的實現(xiàn);第5章通過策略梯度法的連續(xù)控制、學(xué)習(xí)算法和策略模型等,詳細(xì)介紹了深度強化學(xué)習(xí)在連續(xù)控制問題中的應(yīng)用及具體實現(xiàn);第6章通過巡回推銷員問題和魔方問題詳細(xì)介紹了深度強化學(xué)習(xí)在組合優(yōu)化中的應(yīng)用及具體實現(xiàn);第7章通過SeqGAN的文本生成和神經(jīng)網(wǎng)絡(luò)架構(gòu)的搜索詳細(xì)介紹了深度強化學(xué)習(xí)在時間序列數(shù)據(jù)生成的應(yīng)用。在附錄中還給出了Colaboratory和Docker等深度強化學(xué)習(xí)開發(fā)環(huán)境的構(gòu)建。

作者簡介

  [日]伊藤多一,1995年在名古屋大學(xué)理學(xué)研究所完成博士課程,井獲得博士學(xué)位。后一直從事粒子物理學(xué)研究,直到2004年3月。同年,加入了一家專門從事合同數(shù)據(jù)分析的風(fēng)險公司,井參與了多個數(shù)據(jù)分析項目。自2013年以來,他一直在BrainPad公司從事機器學(xué)習(xí)的廣告效果分析工作。自2016年以來,通過深度學(xué)習(xí)參與了圖像分析項目。今津義充,博士學(xué)位(理學(xué)),熟悉統(tǒng)計分析、模型構(gòu)建以及基于數(shù)值分析的基本粒子和核物理研究。自2013年以來,領(lǐng)導(dǎo)了BrainPad公司的定量分析項目,例如需求預(yù)測和數(shù)學(xué)優(yōu)化等。近年來,一直從事利用深度學(xué)習(xí)技術(shù)的項目分析和應(yīng)用研究。須藤廣大,在奈良科學(xué)技術(shù)學(xué)院主修自然語言處理,獲得碩士學(xué)位(信息工程)。后以新畢業(yè)生的身份加入BrainPad公司,井以機器學(xué)習(xí)工程師的身份從事與深度學(xué)習(xí)相關(guān)的項目分析和開發(fā)。仁平將人,碩士學(xué)位,在研究生院主修管理系統(tǒng)工程專業(yè),于2018年加入BrainPad公司成為數(shù)據(jù)科學(xué)家。加入公司后,從事有關(guān)強化學(xué)習(xí)和自然語言處理的項目。川崎悠介,碩士學(xué)位,大學(xué)期間主修信息工程,并于2018年加入BrainPad公司。從事圖像識別和時間序列預(yù)測的相關(guān)項目研究。

圖書目錄

暫缺《Python深度強化學(xué)習(xí)入門:強化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制》目錄

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號