《集體智慧編程》(Programming Collective Intelligence Building Smart Web 2.0 Applications)以機(jī)器學(xué)習(xí)與計(jì)算統(tǒng)計(jì)為主題背景,專門講述如何挖掘和分析Web上的數(shù)據(jù)和資源,如何分析用戶體驗(yàn)、市場營銷、個(gè)人品味等諸多信息,并得出有用的結(jié)論,通過復(fù)雜的算法來從Web網(wǎng)站獲取、收集并分析用戶的數(shù)據(jù)和反饋信息,以便創(chuàng)造新的用戶價(jià)值和商業(yè)價(jià)值。全書內(nèi)容翔實(shí),包括協(xié)作過濾技術(shù)(實(shí)現(xiàn)關(guān)聯(lián)產(chǎn)品推薦功能)、集群數(shù)據(jù)分析(在大規(guī)模數(shù)據(jù)集中發(fā)掘相似的數(shù)據(jù)子集)、搜索引擎核心技術(shù)(爬蟲、索引、查詢引擎、PageRank算法等)、搜索海量信息并進(jìn)行分析統(tǒng)計(jì)得出結(jié)論的優(yōu)化算法、貝葉斯過濾技術(shù)(垃圾郵件過濾、文本過濾)、用決策樹技術(shù)實(shí)現(xiàn)預(yù)測和決策建模功能、社交網(wǎng)絡(luò)的信息匹配技術(shù)、機(jī)器學(xué)習(xí)和人工智能應(yīng)用等?!都w智慧編程》(Programming Collective Intelligence Building Smart Web 2.0 Applications)向讀者介紹了:令在線零售商向用戶提供商品或媒體推薦的協(xié)作型過濾技術(shù);在一個(gè)大型數(shù)據(jù)集中檢測相似項(xiàng)群組的聚類方法;在針對某一問題的數(shù)以百萬計(jì)的可能題解中進(jìn)行搜索,并從中選出最優(yōu)解的優(yōu)化算法;用于垃圾過濾技術(shù)的貝葉斯過濾器,如何根據(jù)單詞類型及其他特征對文檔進(jìn)行分類;用于對在線約會站點(diǎn)的用戶進(jìn)行配對的支持向量機(jī);用于問題求解的智能進(jìn)化技術(shù)——隨著玩游戲的次數(shù)逐漸增多,計(jì)算機(jī)玩家如何通過改進(jìn)自身代碼的方式來發(fā)展技能?!都w智慧編程》(Programming Collective Intelligence Building Smart Web 2.0 Applications)的每一章后都有練習(xí),這些練習(xí)對算法進(jìn)行了擴(kuò)展,使其變得更加強(qiáng)大。讓我們超越以數(shù)據(jù)庫為后端的簡單應(yīng)用系統(tǒng),挖掘互聯(lián)網(wǎng)數(shù)據(jù)的價(jià)值,為我所用!深入講解蘊(yùn)藏于智能Web 2.0應(yīng)用背后的算法原理,介紹挖掘和分析用戶貢獻(xiàn)的內(nèi)容,以創(chuàng)造新的用戶價(jià)值和商業(yè)價(jià)值。