在線凸優(yōu)化：概念、架構(gòu)及核心算法

定　價(jià)：￥69.00

作　者：	[美]伊蘭德·卡贊(Elad Hazan)
出版社：	機(jī)械工業(yè)出版社
叢編項(xiàng)：
標(biāo)　簽：	暫缺

購(gòu)買(mǎi)這本書(shū)可以去

ISBN：	9787111690221	出版時(shí)間：	2021-09-01	包裝：	平裝-膠訂
開(kāi)本：	16開(kāi)	頁(yè)數(shù)：	188	字?jǐn)?shù)：

內(nèi)容簡(jiǎn)介

　　本書(shū)可作為在線凸優(yōu)化大量理論的導(dǎo)論教程。第2~5章主要介紹在線凸優(yōu)化的基本概念、架構(gòu)和核心算法。本書(shū)其余部分則處理更為高級(jí)的算法、更為困難的設(shè)定和與著名的機(jī)器學(xué)習(xí)范式之間的關(guān)系。

作者簡(jiǎn)介

　　埃拉德·哈贊（Elad Hazan）普林斯頓大學(xué)計(jì)算機(jī)科學(xué)教授，谷歌人工智能普林斯頓公司的聯(lián)合創(chuàng)始人和董事。他專(zhuān)注于機(jī)器學(xué)習(xí)和優(yōu)化中基本問(wèn)題的算法設(shè)計(jì)和分析的研究，曾獲得貝爾實(shí)驗(yàn)室獎(jiǎng)、2008年度和2012年度IBM Goldberg論文獎(jiǎng)、歐洲研究理事會(huì)獎(jiǎng)、瑪麗·居里獎(jiǎng)學(xué)金和谷歌研究獎(jiǎng)。他曾在計(jì)算學(xué)習(xí)協(xié)會(huì)指導(dǎo)委員會(huì)任職，并擔(dān)任COLT 2015程序委員會(huì)主席，2017年與他人共同創(chuàng)建了致力于高效優(yōu)化和控制的In8公司。

圖書(shū)目錄

前言
致謝
第1章導(dǎo)論 1
1.1 在線凸優(yōu)化模型 2
1.2 可以用OCO建模的例子 3
1.3 一個(gè)溫和的開(kāi)始: 從專(zhuān)家建議中學(xué)習(xí) 8
1.3.1 加權(quán)多數(shù)算法 10
1.3.2 隨機(jī)加權(quán)多數(shù)算法 12
1.3.3 對(duì)沖 14
1.4 習(xí)題 16
1.5 文獻(xiàn)點(diǎn)評(píng) 17
第2章凸優(yōu)化的基本概念 18
2.1 基本定義和設(shè)定 18
2.1.1 在凸集上的投影 20
2.1.2 條件簡(jiǎn)介 21
2.2 梯度、次梯度下降法 23
2.3 非光滑和非強(qiáng)凸函數(shù)的歸約 27
2.3.1 光滑非強(qiáng)凸函數(shù)的歸約 28
2.3.2 強(qiáng)凸非光滑函數(shù)的歸約 29
2.3.3 一般凸函數(shù)的歸約 32
2.4 例子: 支持向量機(jī)訓(xùn)練 33
2.5 習(xí)題 35
2.6 文獻(xiàn)點(diǎn)評(píng) 37
第3章在線凸優(yōu)化的一階算法 38
3.1 在線梯度下降法 39
3.2 下界 42
3.3 對(duì)數(shù)遺憾 43
3.4 應(yīng)用: 隨機(jī)梯度下降法 45
3.5 習(xí)題 49
3.6 文獻(xiàn)點(diǎn)評(píng) 50
第4章二階方法 51
4.1 動(dòng)機(jī): 通用投資組合選擇 51
4.1.1 主流投資組合理論 51
4.1.2 通用投資組合理論 52
4.1.3 持續(xù)再平衡投資組合 54
4.2 exp-凹函數(shù) 55
4.3 在線牛頓步算法 57
4.4 習(xí)題 63
4.5 文獻(xiàn)點(diǎn)評(píng) 64
第5章正則化 66
5.1 正則函數(shù) 67
5.2 RFTL 算法及其分析 69
5.2.1 元算法的定義 70
5.2.2 遺憾界 70
5.3 在線鏡像下降法 74
5.3.1 遲緩型OMD算法與RFTL 算法的等價(jià)性 75
5.3.2 鏡像下降的遺憾界 76
5.4 應(yīng)用及特殊情形 78
5.4.1 在線梯度下降法的導(dǎo)出 79
5.4.2 乘法更新的導(dǎo)出 79
5.5 隨機(jī)正則化 81
5.5.1 對(duì)凸代價(jià)函數(shù)的擾動(dòng) 82
5.5.2 對(duì)線性代價(jià)函數(shù)的擾動(dòng) 86
5.5.3 專(zhuān)家建議中的擾動(dòng)領(lǐng)袖追隨算法 87
5.6 正則化（選學(xué)） 90
5.7 習(xí)題 96
5.8 文獻(xiàn)點(diǎn)評(píng) 98
第6章 Bandit凸優(yōu)化 100
6.1 BCO設(shè)定 100
6.2 多臂賭博機(jī)問(wèn)題 101
6.3 從有限信息到完整信息的歸約 107
6.3.1 第1部分: 使用無(wú)偏估計(jì) 107
6.3.2 第2部分: 點(diǎn)點(diǎn)梯度估計(jì) 110
6.4 不需要梯度的在線梯度下降算法 113
6.5 BLO遺憾算法（選學(xué)） 116
6.5.1 自和諧障礙 116
6.5.2 一個(gè)近優(yōu)算法 118
6.6 習(xí)題 121
6.7 文獻(xiàn)點(diǎn)評(píng) 122
第7章無(wú)投影算法 123
7.1 回顧: 與線性代數(shù)相關(guān)的概念 123
7.2 動(dòng)機(jī): 矩陣補(bǔ)全與推薦系統(tǒng) 124
7.3 條件梯度法 126
7.4 投影與線性優(yōu)化 131
7.5 在線條件梯度算法 133
7.6 習(xí)題 138
7.7 文獻(xiàn)點(diǎn)評(píng) 139
第8章博弈、對(duì)偶性和遺憾 140
8.1 線性規(guī)劃和對(duì)偶性 141
8.2 零和博弈與均衡 142
8.3 馮·諾伊曼定理的證明 146
8.4 近似線性規(guī)劃 148
8.5 習(xí)題 150
8.6 文獻(xiàn)點(diǎn)評(píng) 150
第9章學(xué)習(xí)理論、泛化和OCO 152
9.1 統(tǒng)計(jì)學(xué)習(xí)理論的設(shè)定 152
9.1.1 過(guò)擬合 153
9.1.2 沒(méi)有免費(fèi)