深度強化學習結合深度學習與強化學習算法各自的優(yōu)勢解決復雜的決策任務。得益于 DeepMind AlphaGo 和 OpenAI Five 成功的案例,深度強化學習受到大量的關注,相關技術廣泛應用于不同的領域。本書分為三大部分,覆蓋深度強化學習的全部內容。第一部分介紹深度學習和強化學習的入門知識、一些非?;A的深度強化學習算法及其實現(xiàn)細節(jié),包括第 1~6 章。第二部分是一些精選的深度強化學習研究題目,這些內容對準備開展深度強化學習研究的讀者非常有用,包括第 7~12 章。第三部分提供了豐富的應用案例,包括 AlphaZero、讓機器人學習跑步等,包括第 13~17 章。本書是為計算機科學專業(yè)背景、希望從零開始學習深度強化學習并開展研究課題和實踐項目的學生準備的。本書也適合沒有很強的機器學習背景、但是希望快速學習深度強化學習并將其應用到具體產品中的軟件工程師閱讀。