注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件社交媒體數(shù)據(jù)挖掘與分析

社交媒體數(shù)據(jù)挖掘與分析

社交媒體數(shù)據(jù)挖掘與分析

定 價:¥79.00

作 者: [美] 加博爾·薩博(Gabor Szabo) 著,李凱,呂天陽 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 數(shù)據(jù)科學(xué)與工程技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787111643685 出版時間: 2020-01-01 包裝: 平裝
開本: 16開 頁數(shù): 219 字?jǐn)?shù):  

內(nèi)容簡介

  《社交媒體數(shù)據(jù)挖掘與分析》由工作在大規(guī)模社交媒體數(shù)據(jù)處理一線的研發(fā)人員撰寫,旨在以更為友好、基礎(chǔ)、實(shí)用的方式幫助你理解在線社交媒體。《社交媒體數(shù)據(jù)挖掘與分析》圍繞著如何探索和理解社交媒體系統(tǒng)的基本組成部分進(jìn)行組織,從用戶角度深入剖析收集和應(yīng)用社交媒體數(shù)據(jù)的機(jī)制,并通過建立在真實(shí)數(shù)據(jù)集上的代碼及分析案例詳細(xì)闡述相關(guān)數(shù)據(jù)挖掘方法、技術(shù)和工具?!渡缃幻襟w數(shù)據(jù)挖掘與分析》共7章,第1章介紹典型用戶在社交媒體服務(wù)上的行為及其在不同服務(wù)中的普遍相似性;第2章主要討論創(chuàng)造了社交網(wǎng)絡(luò)的用戶之間的連接;第3章主要探討時間在社交系統(tǒng)中所扮演的角色,并且介紹幫助你理解其作用的工具;第4章回顧自然語言處理技術(shù);第5章介紹分析大型數(shù)據(jù)集的挑戰(zhàn);第6章展示如何用機(jī)器學(xué)習(xí)技術(shù)預(yù)測人們喜歡哪類電影,并對預(yù)測結(jié)果進(jìn)行評估;第7章由淺入深地分析全書中用于分析不同問題的通用統(tǒng)計(jì)模式,以及如何使用類似的分析技術(shù)去理解它們。

作者簡介

  加博爾·薩博(Gabor Szabo),致力于社交網(wǎng)絡(luò)、自組織在線生態(tài)系統(tǒng)、交通運(yùn)輸系統(tǒng)和自動駕駛領(lǐng)域的大規(guī)模數(shù)據(jù)分析和建模問題。此前任職于哈佛醫(yī)學(xué)院、圣母大學(xué)和惠普實(shí)驗(yàn)室,期間的研究重點(diǎn)是描述在線社區(qū)和生物系統(tǒng)中的隨機(jī)組織網(wǎng)絡(luò)。在此之后,他建立了分布式算法來理解和預(yù)測Twitter中的用戶行為。他創(chuàng)建了Lyft拼車網(wǎng)絡(luò)的資源分配模型,最近領(lǐng)導(dǎo)著特斯拉自動輔助駕駛( Tesla's Autopilot)項(xiàng)目的一個團(tuán)隊(duì)。格爾·波拉特坎(Gungor Polatkan),機(jī)器學(xué)習(xí)專家和工程領(lǐng)導(dǎo)者,參與構(gòu)建了Linkedln和Twitter的服務(wù)于個性化內(nèi)容的大規(guī)模分布式數(shù)據(jù)管道。最近,他領(lǐng)導(dǎo)著Linkedln的AI后端的設(shè)計(jì)與實(shí)現(xiàn),并將其推薦引擎從無到有地提升為能夠從5億多用戶中學(xué)習(xí)數(shù)十億個系數(shù)的超個性化模型。他在Linkedln部署了早一批深度排名模型,用于Linkedln的垂直搜索,改進(jìn)了其人才搜索功能。他樂于領(lǐng)導(dǎo)團(tuán)隊(duì)、指導(dǎo)工程師,并在產(chǎn)品的快速迭代過程中培育技術(shù)嚴(yán)謹(jǐn)和工匠精神的文化。在加入Linkedln之前,他曾在Twitter、普林斯頓大學(xué)、谷歌、MERL和加州大學(xué)伯克利分校的幾個著名的應(yīng)用研究小組工作。他在ML&AI期刊和會議發(fā)表并評審過論文,如UAI、ICML和PAMI。P.奧斯卡·柏金(P.Oscar Boykin),在Stripe致力于機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施的建設(shè),建立了預(yù)測大規(guī)模欺詐行為的系統(tǒng)。在加入Stripe之前,Oscar在Twitter工作了4年多的時間,先是致力于廣告的建模和預(yù)測,而后投身于數(shù)據(jù)基礎(chǔ)設(shè)施系統(tǒng)的建設(shè)。在Twitter,Oscar與他人合作開發(fā)了許多開源scala庫,包括Scalding、Algebird、Summingbird和Chill。在加入Twitter之前,Oscar是佛羅里達(dá)大學(xué)電子與計(jì)算機(jī)工程系的助理教授。Oscar在加州大學(xué)洛杉磯分校獲得物理學(xué)博士學(xué)位,作為合著者在學(xué)術(shù)期刊和會議上發(fā)表了數(shù)十篇論文。安東尼奧斯·查基奧普洛斯(Antonios Chalkiopoulos),一位快速和大型數(shù)據(jù)分布式系統(tǒng)專家,具有在媒體、物聯(lián)網(wǎng)、零售和金融行業(yè)交付生產(chǎn)級數(shù)據(jù)管道的經(jīng)驗(yàn)。Antonios是大數(shù)據(jù)領(lǐng)域的專著作者、開源社區(qū)的貢獻(xiàn)者、Landoop LTD的聯(lián)合創(chuàng)始人和CEO。Landoop LTD為動態(tài)數(shù)據(jù)創(chuàng)建了創(chuàng)新性的、曾獲獎勵的Lenses平臺。該平臺保證了流數(shù)據(jù)的可見、可控,它通過直觀的Web接口支持?jǐn)?shù)據(jù)發(fā)現(xiàn),并為數(shù)據(jù)的移動、監(jiān)控、預(yù)警、管理、多重租賃、安全提供了全面的SQL支持,為構(gòu)建和管理實(shí)時數(shù)據(jù)管道和微服務(wù)提供了完整的用戶體驗(yàn)。

圖書目錄

譯者序
前言
致謝
作者簡介
技術(shù)編輯簡介
第1章 用戶:誰參與社交媒體
1.1 測量Wikipedia中用戶行為的變化
1.1.1 用戶活動的多樣性
1.1.2 人類活動中的長尾效應(yīng)
1.2 隨處可見的長尾效應(yīng):80/20定律
1.3 Twitter上的在線行為
1.3.1 檢索用戶的Tweet
1.3.2 對數(shù)分區(qū)
1.3.3 Twitter上的用戶活動
1.4 總結(jié)
第2章 網(wǎng)絡(luò):社交媒體如何運(yùn)行
2.1 社交網(wǎng)絡(luò)的類型和屬性
2.1.1 用戶何時創(chuàng)建連接:顯式網(wǎng)絡(luò)
2.1.2 有向圖與無向圖
2.1.3 節(jié)點(diǎn)和邊的屬性
2.1.4 加權(quán)圖
2.1.5 由活動構(gòu)建圖:隱式網(wǎng)絡(luò)
2.2 網(wǎng)絡(luò)可視化
2.3 度:贏家通吃
2.3.1 連接計(jì)數(shù)
2.3.2 用戶連接的長尾分布
2.3.3 超越理想網(wǎng)絡(luò)模型
2.4 捕獲相關(guān):三角結(jié)構(gòu)、簇和同配性
2.4.1 局部三角結(jié)構(gòu)和簇
2.4.2 同配性
2.5 總結(jié)
第3章 時序過程:用戶何時使用社交媒體
3.1 傳統(tǒng)模型如何描述事件發(fā)生的時間
3.2 事件間隔時間
3.2.1 與無記憶過程的對比
3.2.2 自相關(guān)
3.2.3 與無記憶過程的偏離
3.2.4 用戶活動中的時間周期
3.3 個體行為的爆發(fā)
3.4 預(yù)測長期指標(biāo)
3.4.1 發(fā)現(xiàn)趨勢
3.4.2 發(fā)現(xiàn)季節(jié)性
3.4.3 利用ARIMA預(yù)測時間序列
3.5 總結(jié)
第4章 內(nèi)容:社交媒體中有什么
4.1 定義內(nèi)容:聚焦于文本和非結(jié)構(gòu)數(shù)據(jù)
4.1.1 從文本生成特征:自然語言處理基礎(chǔ)
4.1.2 文本中詞條的基本統(tǒng)計(jì)
4.2 使用內(nèi)容特征識別主題
4.2.1 話題的流行度
4.2.2 用戶個體興趣有多么多樣化
4.3 從高維文本中抽取低維信息
4.4 總結(jié)
……
第5章 處理大型數(shù)據(jù)集
第6章 學(xué)習(xí)、映射和推薦
第7章 結(jié)論

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號