注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)其他編程語言/工具集體智慧編程

集體智慧編程

集體智慧編程

定 價(jià):¥59.80

作 者: (美)西格蘭 著,莫映,王開福 譯
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 程序設(shè)計(jì)

ISBN: 9787121075391 出版時(shí)間: 2009-01-01 包裝: 平裝
開本: 16開 頁數(shù): 334 字?jǐn)?shù):  

內(nèi)容簡介

  《集體智慧編程》(Programming Collective Intelligence Building Smart Web 2.0 Applications)以機(jī)器學(xué)習(xí)與計(jì)算統(tǒng)計(jì)為主題背景,專門講述如何挖掘和分析Web上的數(shù)據(jù)和資源,如何分析用戶體驗(yàn)、市場營銷、個(gè)人品味等諸多信息,并得出有用的結(jié)論,通過復(fù)雜的算法來從Web網(wǎng)站獲取、收集并分析用戶的數(shù)據(jù)和反饋信息,以便創(chuàng)造新的用戶價(jià)值和商業(yè)價(jià)值。全書內(nèi)容翔實(shí),包括協(xié)作過濾技術(shù)(實(shí)現(xiàn)關(guān)聯(lián)產(chǎn)品推薦功能)、集群數(shù)據(jù)分析(在大規(guī)模數(shù)據(jù)集中發(fā)掘相似的數(shù)據(jù)子集)、搜索引擎核心技術(shù)(爬蟲、索引、查詢引擎、PageRank算法等)、搜索海量信息并進(jìn)行分析統(tǒng)計(jì)得出結(jié)論的優(yōu)化算法、貝葉斯過濾技術(shù)(垃圾郵件過濾、文本過濾)、用決策樹技術(shù)實(shí)現(xiàn)預(yù)測和決策建模功能、社交網(wǎng)絡(luò)的信息匹配技術(shù)、機(jī)器學(xué)習(xí)和人工智能應(yīng)用等?!都w智慧編程》(Programming Collective Intelligence Building Smart Web 2.0 Applications)向讀者介紹了:令在線零售商向用戶提供商品或媒體推薦的協(xié)作型過濾技術(shù);在一個(gè)大型數(shù)據(jù)集中檢測相似項(xiàng)群組的聚類方法;在針對某一問題的數(shù)以百萬計(jì)的可能題解中進(jìn)行搜索,并從中選出最優(yōu)解的優(yōu)化算法;用于垃圾過濾技術(shù)的貝葉斯過濾器,如何根據(jù)單詞類型及其他特征對文檔進(jìn)行分類;用于對在線約會站點(diǎn)的用戶進(jìn)行配對的支持向量機(jī);用于問題求解的智能進(jìn)化技術(shù)——隨著玩游戲的次數(shù)逐漸增多,計(jì)算機(jī)玩家如何通過改進(jìn)自身代碼的方式來發(fā)展技能?!都w智慧編程》(Programming Collective Intelligence Building Smart Web 2.0 Applications)的每一章后都有練習(xí),這些練習(xí)對算法進(jìn)行了擴(kuò)展,使其變得更加強(qiáng)大。讓我們超越以數(shù)據(jù)庫為后端的簡單應(yīng)用系統(tǒng),挖掘互聯(lián)網(wǎng)數(shù)據(jù)的價(jià)值,為我所用!深入講解蘊(yùn)藏于智能Web 2.0應(yīng)用背后的算法原理,介紹挖掘和分析用戶貢獻(xiàn)的內(nèi)容,以創(chuàng)造新的用戶價(jià)值和商業(yè)價(jià)值。

作者簡介

  Toby Segaran是Genstruct公司的軟件開發(fā)主管,這家公司涉足計(jì)算生物領(lǐng)域,他本人的職責(zé)是設(shè)計(jì)算法,并利用數(shù)據(jù)挖掘技術(shù)來輔助了解藥品機(jī)理。Toby Segaran還為其他幾家公司和數(shù)個(gè)開源項(xiàng)目服務(wù),幫助它們從收集到的數(shù)據(jù)當(dāng)中分析并發(fā)掘價(jià)值。除此以外,TobySegaran還建立了幾個(gè)免費(fèi)的網(wǎng)站應(yīng)用,包括流行的tasktoy和Lazybase。他非常喜歡滑雪與品酒,其博客地址是bl09.kiwitobes.corn,現(xiàn)居于舊金山。

圖書目錄

前言
第1章 集體智慧導(dǎo)言
什么是集體智慧
什么是機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)的局限
真實(shí)生活中的例子
學(xué)習(xí)型算法的其他用途
第2章 提供推薦
協(xié)作型過濾
搜集偏好
尋找相近的用戶
推薦物品
匹配商品
構(gòu)建一個(gè)基于del.icio.us的鏈接推薦系統(tǒng)
基于物品的過濾
使用MovieLens數(shù)據(jù)集
基于用戶進(jìn)行過濾還是基于物品進(jìn)行過濾
練習(xí)
第3章 發(fā)現(xiàn)群組
監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)
單詞向量
分級聚類
繪制樹狀圖
列聚類
K-均值聚類
針對偏好的聚類
以二維形式展現(xiàn)數(shù)據(jù)
有關(guān)聚類的其他事宜
練習(xí)
第4章 搜索與排名
搜索引擎的組成
一個(gè)簡單的爬蟲程序
建立索引
查詢
基于內(nèi)容的排名
利用外部回指鏈接
從點(diǎn)擊行為中學(xué)習(xí)
練習(xí)
第5章 優(yōu)化
組團(tuán)旅游
描述題解
成本函數(shù)
隨機(jī)搜索
爬山法
模擬退火算法
遺傳算法
真實(shí)的航班搜索
涉及偏好的優(yōu)化
網(wǎng)絡(luò)可視化
其他可能的應(yīng)用場合
練習(xí)
第6章 文檔過濾
過濾垃圾信息
文檔和單詞
對分類器進(jìn)行訓(xùn)練
計(jì)算概率
樸素分類器
費(fèi)舍爾方法
將經(jīng)過訓(xùn)練的分類器持久化
過濾博客訂閱源
對特征檢測的改進(jìn)
使用Akismet
替代方法
練習(xí)
第7章 決策樹建模
預(yù)測注冊用戶
引入決策樹
對樹進(jìn)行訓(xùn)練
選擇最合適的拆分方案
以遞歸方式構(gòu)造樹
決策樹的顯示
對新的觀測數(shù)據(jù)進(jìn)行分類
決策樹的剪枝
處理缺失數(shù)據(jù)
處理數(shù)值型結(jié)果
對住房價(jià)格進(jìn)行建模
對“熱度”評價(jià)進(jìn)行建模
什么時(shí)候使用決策樹
練習(xí)
第8章 構(gòu)建價(jià)格模型
構(gòu)造一個(gè)樣本數(shù)據(jù)集
k-最近鄰算法
為近鄰分配權(quán)重
交叉驗(yàn)證
不同類型的變量
對縮放結(jié)果進(jìn)行優(yōu)化
不對稱分布
使用真實(shí)數(shù)據(jù)——eBay API
何時(shí)使用k-最近鄰算法
練習(xí)
第9章 高階分類:核方法與SVM
婚介數(shù)據(jù)集
數(shù)據(jù)中的難點(diǎn)
基本的線性分類
分類特征
對數(shù)據(jù)進(jìn)行縮放處理
理解核方法
支持向量機(jī)
使用LIBSVM
基于Facebook的匹配
練習(xí)
第10章 尋找獨(dú)立特征
搜集一組新聞
先前的方法
非負(fù)矩陣因式分解
結(jié)果呈現(xiàn)
利用股票市場的數(shù)據(jù)
練習(xí)
第11章 智能進(jìn)化
什么是遺傳編程
將程序以樹形方式表示
構(gòu)造初始種群
測試題解
對程序進(jìn)行變異
交叉
構(gòu)筑環(huán)境
一個(gè)簡單的游戲
更多可能性
練習(xí)
第12章 算法總結(jié)
貝葉斯分類器
決策樹分類器
神經(jīng)網(wǎng)絡(luò)
支持向量機(jī)
k-最近鄰
聚類
多維縮放
非負(fù)矩陣因式分解
優(yōu)化
附錄A:第三方函數(shù)庫
附錄B:數(shù)學(xué)公式
索引

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號