注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫國之重器出版工程 特異群組挖掘

國之重器出版工程 特異群組挖掘

國之重器出版工程 特異群組挖掘

定 價:¥139.00

作 者: 熊贇,朱揚勇 著
出版社: 人民郵電出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787115543264 出版時間: 2020-08-01 包裝: 平裝
開本: 小16開 頁數(shù): 237 字?jǐn)?shù):  

內(nèi)容簡介

  高價值、低密度是大數(shù)據(jù)的特征,挖掘高價值、低密度的數(shù)據(jù)對象是大數(shù)據(jù)的一項重要工作。特異群組是一類高價值、低密度的數(shù)據(jù)形態(tài),是指在眾多行為對象中,少數(shù)對象群體具有一定數(shù)量的相同(或相似)的行為模式,表現(xiàn)出相異于大多數(shù)對象而形成的異常的群組。特異群組挖掘在證券金融、醫(yī)療保險、智能交通、社會網(wǎng)絡(luò)和生命科學(xué)研究等領(lǐng)域具有重要的應(yīng)用價值。對特異群組挖掘的研究代表了數(shù)據(jù)挖掘從淺層到深層的發(fā)展趨勢和必要性。本書系統(tǒng)地闡述了特異群組挖掘任務(wù),包括介紹了特異群組挖掘的概念,分析了特異群組挖掘任務(wù)與聚類、異常等任務(wù)之間的差異,給出了特異群組挖掘任務(wù)的相關(guān)算法,并且列舉了特異群組挖掘的幾個重點應(yīng)用。本書適合大數(shù)據(jù)研究人員、大數(shù)據(jù)工程師、大數(shù)據(jù)應(yīng)用分析師、大數(shù)據(jù)產(chǎn)業(yè)從業(yè)人員等閱讀,也可作為數(shù)據(jù)科學(xué)、大數(shù)據(jù)專業(yè)本科生和研究生的教學(xué)用書。

作者簡介

  熊贇熊贇,復(fù)旦大學(xué)計算機(jī)科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師,上海市數(shù)據(jù)科學(xué)重點實驗室副主任。研究興趣包括數(shù)據(jù)科學(xué)、數(shù)據(jù)挖掘和大數(shù)據(jù)處理。研究工作得到了國家自然科學(xué)基金、國家863計劃、國家科技支撐計劃、上海市科學(xué)技術(shù)委員會基金等資助,在TKDE、KDD、AAAI、ICDM、CIKM等數(shù)據(jù)領(lǐng)域國際權(quán)威期刊和會議上發(fā)表論文80余篇,擔(dān)任ACM Computing Surveys、TKDE、TKDD等國際期刊審稿人。在國內(nèi)率先開展大數(shù)據(jù)和數(shù)據(jù)科學(xué)的研究工作,出版了數(shù)據(jù)科學(xué)專著《數(shù)據(jù)學(xué)》,提出了一類大數(shù)據(jù)形態(tài)——特異群組,提出了一批新型的大數(shù)據(jù)挖掘算法,這些算法已被應(yīng)用于醫(yī)療、交通和金融等上海市大數(shù)據(jù)建設(shè)的重要領(lǐng)域。 朱揚勇朱揚勇,復(fù)旦大學(xué)計算機(jī)科學(xué)技術(shù)學(xué)院教授、學(xué)術(shù)委員會主任,上海市數(shù)據(jù)科學(xué)重點實驗室主任。《大數(shù)據(jù)》期刊副主編,大數(shù)據(jù)協(xié)同安全技術(shù)國家工程實驗室副理事長,中國自動化學(xué)會國防大數(shù)據(jù)專業(yè)委員會副主任,農(nóng)業(yè)大數(shù)據(jù)產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟副理事長兼首席科學(xué)家。2004年開始從事數(shù)據(jù)科學(xué)研究,2008年提出數(shù)據(jù)資源保護(hù)和開發(fā)利用,2009年發(fā)表了數(shù)據(jù)科學(xué)論文Data Explosion, Data Nature and Dataology,并出版數(shù)據(jù)科學(xué)專著《數(shù)據(jù)學(xué)》。第462次香山科學(xué)會議“數(shù)據(jù)科學(xué)與大數(shù)據(jù)的理論問題探索”的執(zhí)行主席?!洞髷?shù)據(jù)技術(shù)與應(yīng)用叢書》主編,《大數(shù)據(jù)資源》主編,大數(shù)據(jù)科普圖書《旖旎數(shù)據(jù)》作者。研究興趣包括數(shù)據(jù)科學(xué)和大數(shù)據(jù)技術(shù),提出數(shù)據(jù)界(Data Nature)、數(shù)據(jù)學(xué)(Dataology)、數(shù)據(jù)身、數(shù)據(jù)自治、數(shù)據(jù)財政等概念,近期研究重點為數(shù)據(jù)真實性、數(shù)據(jù)財政、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)自治與數(shù)據(jù)跨境等。

圖書目錄

目 錄
第 1章 緒論 1
1.1 大數(shù)據(jù) 2
1.2 大數(shù)據(jù)挖掘 3
1.3 特異群組挖掘任務(wù) 6
1.4 小結(jié) 8
參考文獻(xiàn) 9
第 2章 為什么需要特異群組挖掘 11
2.1 聚類 12
2.2 異常檢測 13
2.3 圖數(shù)據(jù)上的異常挖掘 20
2.4 特異群組挖掘 28
2.5 特異群組挖掘與其他任務(wù)間的關(guān)系 31
2.6 小結(jié) 33
參考文獻(xiàn) 33
第3章 特異群組挖掘的應(yīng)用 45
3.1 證券市場操縱行為挖掘 46
3.2 醫(yī)療保險中的保費欺詐行為挖掘 48
3.3 有組織犯罪行為挖掘 50
3.4 金融風(fēng)控中團(tuán)伙欺詐檢測 51
3.5 生命科學(xué)研究中的特異群組挖掘 52
3.6 流行病學(xué)調(diào)查中的密切接觸者發(fā)現(xiàn) 53
3.7 其他應(yīng)用場景 53
3.8 小結(jié) 54
參考文獻(xiàn) 55
第4章 特異群組挖掘原理與框架 59
4.1 特異群組挖掘形式化描述 60
4.2 特異群組挖掘框架算法 63
4.3 實驗與結(jié)果分析 66
4.4 特異群組挖掘應(yīng)用步驟 67
4.5 小結(jié) 68
參考文獻(xiàn) 69
第5章 相似性與相似性連接 71
5.1 相似性 72
5.2 相似性連接 74
5.3 相似性搜索中的索引結(jié)構(gòu) 77
5.4 異質(zhì)網(wǎng)絡(luò)上的自相似性連接 79
5.4.1 異質(zhì)信息網(wǎng)絡(luò) 79
5.4.2 異質(zhì)網(wǎng)絡(luò)上的相似性度量 83
5.4.3 基于路徑的自相似性連接 83
5.5 實驗與結(jié)果分析 90
5.5.1 效率分析 91
5.5.2 有效性分析 95
5.5.3 Topk相似連接示例 98
5.6 小結(jié) 101
參考文獻(xiàn) 101
第6章 無監(jiān)督的復(fù)雜行為數(shù)據(jù)表示學(xué)習(xí) 107
6.1 行為數(shù)據(jù) 108
6.2 表示學(xué)習(xí) 110
6.2.1 詞嵌入模型 110
6.2.2 圖嵌入模型 112
6.2.3 異質(zhì)網(wǎng)絡(luò)表示學(xué)習(xí) 116
6.2.4 知識圖譜表示學(xué)習(xí) 117
6.2.5 用戶-商品對表示學(xué)習(xí) 117
6.3 基于交互圖嵌入的復(fù)雜行為數(shù)據(jù)表示學(xué)習(xí) 118
6.3.1 交互圖定義 118
6.3.2 無屬性交互圖嵌入 122
6.3.3 IGE模型 124
6.4 實驗與結(jié)果分析 129
6.4.1 實驗描述 129
6.4.2 實驗結(jié)果分析 131
6.5 IGE算法在證券投資行為分析中的應(yīng)用 135
6.6 小結(jié) 139
參考文獻(xiàn) 139
第7章 半監(jiān)督的復(fù)雜行為數(shù)據(jù)表示學(xué)習(xí) 147
7.1 圖半監(jiān)督學(xué)習(xí) 148
7.2 問題定義 150
7.3 算法模型 151
7.4 實驗與結(jié)果分析 153
7.4.1 實驗描述 153
7.4.2 實驗結(jié)果分析 154
7.5 小結(jié) 157
參考文獻(xiàn) 157
第8章 半監(jiān)督群組檢測 159
8.1 群組檢測 160
8.2 問題定義 162
8.3 算法模型 163
8.3.1 判別器 163
8.3.2 生成器 164
8.3.3 預(yù)訓(xùn)練與強(qiáng)制教學(xué) 166
8.3.4 群組生成 167
8.4 實驗與結(jié)果分析 168
8.4.1 實驗描述 168
8.4.2 實驗結(jié)果分析 169
8.5 小結(jié) 170
參考文獻(xiàn) 170
第9章 增量復(fù)雜行為數(shù)據(jù)特征分析 173
9.1 問題定義 174
9.2 增量復(fù)雜行為數(shù)據(jù)特征表示算法 175
9.2.1 日交易記錄編碼 175
9.2.2 預(yù)測編碼 177
9.2.3 生成式對抗網(wǎng)絡(luò) 177
9.2.4 特征向量表示 178
9.3 方法應(yīng)用與實驗分析:游資賬戶識別 179
9.3.1 業(yè)務(wù)問題定義 179
9.3.2 數(shù)據(jù)來源與預(yù)處理 181
9.3.3 游資賬戶識別 183
9.3.4 游資賬戶聚類 184
9.4 小結(jié) 185
參考文獻(xiàn) 185
第 10章 面向動態(tài)圖的節(jié)點表示學(xué)習(xí) 187
10.1 動態(tài)網(wǎng)絡(luò)節(jié)點嵌入 188
10.1.1 靜態(tài)網(wǎng)絡(luò)節(jié)點嵌入方法 190
10.1.2 單向量節(jié)點嵌入表示方法 191
10.1.3 多向量節(jié)點嵌入表示方法 192
10.1.4 函數(shù)式節(jié)點嵌入表示方法 193
10.2 問題定義 194
10.3 DynGraphGAN算法 195
10.3.1 生成器 197
10.3.2 判別器 198
10.3.3 算法細(xì)節(jié) 200
10.4 實驗與結(jié)果分析 201
10.4.1 數(shù)據(jù)集 201
10.4.2 基準(zhǔn)算法 202
10.4.3 評估任務(wù) 203
10.4.4 鏈路重構(gòu)和鏈路預(yù)測分析 204
10.4.5 參數(shù)敏感性分析 207
10.5 小結(jié) 209
參考文獻(xiàn) 209
第 11章 多源網(wǎng)絡(luò)對齊 213
11.1 多源數(shù)據(jù)網(wǎng)絡(luò) 214
11.2 問題定義 216
11.3 HGANE算法 217
11.3.1 層次圖注意機(jī)制 217
11.3.2 對齊網(wǎng)絡(luò)表示 220
11.3.3 面向協(xié)同鏈接預(yù)測的網(wǎng)絡(luò)表示框架 222
11.4 實驗與結(jié)果分析 223
11.4.1 數(shù)據(jù)集 223
11.4.2 對比方法 224
11.4.3 實驗設(shè)置 225
11.4.4 實驗結(jié)果 226
11.4.5 假設(shè)驗證 227
11.4.6 參數(shù)分析 228
11.5 小結(jié) 230
參考文獻(xiàn) 230
第 12章 總結(jié)與展望 233
12.1 總結(jié) 234
12.2 展望 236

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號