注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)庫挖掘/數(shù)據(jù)倉庫機(jī)器學(xué)習(xí):實(shí)用案例解析

機(jī)器學(xué)習(xí):實(shí)用案例解析

機(jī)器學(xué)習(xí):實(shí)用案例解析

定 價(jià):¥69.00

作 者: Drew Conway & John Myles White 著,陳開江 劉逸哲 孟曉楠 譯羅森林 審校
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 編程語言與程序設(shè)計(jì) 計(jì)算機(jī)與互聯(lián)網(wǎng)

ISBN: 9787111417316 出版時(shí)間: 2013-03-01 包裝: 平裝
開本: 16 頁數(shù): 320 字?jǐn)?shù):  

內(nèi)容簡介

  O’Reilly Media通過圖書、雜志、在線服務(wù)、調(diào)查研究和會(huì)議等方式傳播創(chuàng)新知識。自1978年開始,O’Reilly一直都是前沿發(fā)展的見證者和推動(dòng)者。超級極客們正在開創(chuàng)著未來,而我們關(guān)注真正重要的技術(shù)趨勢——通過放大那些“細(xì)微的信號”來刺激社會(huì)對新科技的應(yīng)用。作為技術(shù)社區(qū)中活躍的參與者,O’Reilly的發(fā)展充滿了對創(chuàng)新的倡導(dǎo)、創(chuàng)造和發(fā)揚(yáng)光大。O’Reilly為軟件開發(fā)人員帶來革命性的“動(dòng)物書”;創(chuàng)建第一個(gè)商業(yè)網(wǎng)站(GNN);組織了影響深遠(yuǎn)的開放源代碼峰會(huì),以至于開源軟件運(yùn)動(dòng)以此命名;創(chuàng)立了Make雜志,從而成為DIY革命的主要先鋒;公司一如既往地通過多種形式締結(jié)信息與人的紐帶。O’Reilly的會(huì)議和峰會(huì)集聚了眾多超級極客和高瞻遠(yuǎn)矚的商業(yè)領(lǐng)袖,共同描繪出開創(chuàng)新產(chǎn)業(yè)的革命性思想。作為技術(shù)人士獲取信息的選擇,O’Reilly現(xiàn)在還將先鋒專家的知識傳遞給普通的計(jì)算機(jī)用戶。無論是通過書籍出版,在線服務(wù)或者面授課程,每一項(xiàng)O’Reilly的產(chǎn)品都反映了公司不可動(dòng)搖的理念——信息是激發(fā)創(chuàng)新的力量。

作者簡介

  Drew Conway,機(jī)器學(xué)習(xí)專家,擁有豐富的數(shù)據(jù)分析、處理工作經(jīng)驗(yàn)。目前主要利用數(shù)學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)技術(shù)研究國際關(guān)系、沖突和恐怖主義等。他曾作為研究員在美國情報(bào)和國防部門供職數(shù)年。他擁有紐約大學(xué)政治系博士學(xué)位,曾為多種雜志撰寫文章,是機(jī)器學(xué)習(xí)領(lǐng)域的著名學(xué)者。John Myles White,機(jī)器學(xué)習(xí)專家,擁有豐富的數(shù)據(jù)分析、處理工作經(jīng)驗(yàn)。目前主要從理論和實(shí)驗(yàn)的角度來研究人類如何做出決定,同時(shí)還是幾個(gè)流行的R語言程序包的主要維護(hù)者,包括ProjectTemplate和log4r。他擁有普林斯頓大學(xué)哲學(xué)系博士學(xué)位,曾為多家技術(shù)雜志撰稿,發(fā)表過許多關(guān)于機(jī)器學(xué)習(xí)的論文,并在眾多國際會(huì)議上發(fā)表演講。譯者介紹陳開江,新浪微博搜索部研發(fā)工程師,曾獨(dú)立負(fù)責(zé)微博內(nèi)容反垃圾系統(tǒng)、微博精選內(nèi)容挖掘算法、自助客服系統(tǒng)(包括自動(dòng)回復(fù)、主動(dòng)挖掘、輿情監(jiān)測)等項(xiàng)目,目前主要從事社交挖掘、推薦算法研究、機(jī)器學(xué)習(xí)、自然語言處理相關(guān)工作,研究興趣是社交網(wǎng)絡(luò)的個(gè)性化推薦。劉逸哲,阿里巴巴,CBU基礎(chǔ)平臺部搜索與推薦團(tuán)隊(duì)核心技術(shù)與query分析方向負(fù)責(zé)人,機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域及圈子負(fù)責(zé)人。曾任中國雅虎相關(guān)性團(tuán)隊(duì)、自然語言處理團(tuán)隊(duì)算法工程師;AvePoint.inc開發(fā)工程師,從事企業(yè)級搜索引擎開發(fā)。研究興趣是機(jī)器學(xué)習(xí)、自然語言處理及個(gè)性化推薦等算法在大規(guī)模數(shù)據(jù)上的應(yīng)用。孟曉楠,一淘廣告技術(shù),阿里非搜索廣告算法負(fù)責(zé)人,負(fù)責(zé)用戶行為分析、建模與細(xì)分,RTB競價(jià)算法,展示廣告CTR預(yù)估與SEM優(yōu)化。曾工作于網(wǎng)易杭州研究院,參與過分布式全文檢索系統(tǒng)和網(wǎng)易博客產(chǎn)品的數(shù)據(jù)挖掘算法開發(fā)。研究興趣是計(jì)算廣告技術(shù)、機(jī)器學(xué)習(xí)、大數(shù)據(jù)技術(shù)、信息檢索等。

圖書目錄

前言    1
第1章 使用R語言    9
R與機(jī)器學(xué)習(xí)    10
第2章 數(shù)據(jù)分析    36
分析與驗(yàn)證    36
什么是數(shù)據(jù)    37
推斷數(shù)據(jù)的類型    40
推斷數(shù)據(jù)的含義    42
數(shù)值摘要表    43
均值、中位數(shù)、眾數(shù)    44
分位數(shù)    46
標(biāo)準(zhǔn)差和方差    47
可視化分析數(shù)據(jù)    49
列相關(guān)的可視化    68
第3章 分類:垃圾過濾    77
非此即彼:二分類    77
漫談條件概率    81
試寫第一個(gè)貝葉斯垃圾分類器    82
第4章 排序:智能收件箱    97
次序未知時(shí)該如何排序    97
按優(yōu)先級給郵件排序    98
實(shí)現(xiàn)一個(gè)智能收件箱    102
第5章 回歸模型:預(yù)測網(wǎng)頁訪問量    128
回歸模型簡介    128
預(yù)測網(wǎng)頁流量    142
定義相關(guān)性    152
第6章 正則化:文本回歸    155
數(shù)據(jù)列之間的非線性關(guān)系:超越直線    155
避免過擬合的方法    164
文本回歸    174
第7章 優(yōu)化:密碼破譯    182
優(yōu)化簡介    182
嶺回歸    188
密碼破譯優(yōu)化問題    193
第8章 PCA:構(gòu)建股票市場指數(shù)    203
無監(jiān)督學(xué)習(xí)    203
主成分分析    204
第9章 MDS:可視化地研究參議員相似性    212
基于相似性聚類    212
如何對美國參議員做聚類    219
第10章 kNN:推薦系統(tǒng)    229
k近鄰算法    229
R語言程序包安裝數(shù)據(jù)    235
第11章 分析社交圖譜    239
社交網(wǎng)絡(luò)分析    239
用黑客的方法研究Twitter的社交關(guān)系圖數(shù)據(jù)    244
分析Twitter社交網(wǎng)絡(luò)    252
第12章 模型比較    270
SVM:支持向量機(jī)    270
算法比較    280
參考文獻(xiàn)    287

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號