注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)O'Reilly:基于AWS的數(shù)據(jù)科學(xué)實(shí)踐

O'Reilly:基于AWS的數(shù)據(jù)科學(xué)實(shí)踐

O'Reilly:基于AWS的數(shù)據(jù)科學(xué)實(shí)踐

定 價(jià):¥148.00

作 者: [美]克里斯·弗雷格利(Chris Fregly),[美]安杰·巴斯(Antje Barth),孟然 譯
出版社: 中國(guó)電力出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書可以去


ISBN: 9787519869663 出版時(shí)間: 2022-10-01 包裝: 平裝-膠訂
開本: 16開 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  將Amazon AI和ML服務(wù)棧應(yīng)用到真實(shí)世界的應(yīng)用場(chǎng)景,如自然語(yǔ)言處理、計(jì)算機(jī)視覺、欺詐檢測(cè)、對(duì)話式設(shè)備等。使用Amazon SageMaker Autopilot,通過自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)實(shí)現(xiàn)特定應(yīng)用場(chǎng)景的子集。深入理解一個(gè)基于BERT的自然語(yǔ)言處理場(chǎng)景的模型開發(fā)的完整生命周期,包括數(shù)據(jù)接入、數(shù)據(jù)分析以及更多。將所有組件包裝成一個(gè)可重復(fù)的機(jī)器學(xué)習(xí)運(yùn)維流水線。通過Amazon Kinesis和Amazon Managed Streaming for Apache Kafka(MSK),在實(shí)時(shí)數(shù)據(jù)流中探索實(shí)時(shí)機(jī)器學(xué)習(xí)、異常檢測(cè)和流分析。了解數(shù)據(jù)科學(xué)項(xiàng)目和工作流中的最佳安全實(shí)踐,包括在數(shù)據(jù)接入和分析、模型訓(xùn)練和部署過程中應(yīng)用AWS Identity and Access Management(IAM)、鑒權(quán)、授權(quán)。

作者簡(jiǎn)介

  Chris Fregly是AWS的首席AI和機(jī)器學(xué)習(xí)開發(fā)者和布道者,居住在舊金山。他經(jīng)常在全世界的AI和機(jī)器學(xué)習(xí)會(huì)議上演講,包括O’Reilly AI Superstream系列。之前,Chris曾是PipelineAI的創(chuàng)建者,Databricks的解決方案工程師,以及Netflix的軟件工程師。Antje Barth是AWS的高級(jí)AI和機(jī)器學(xué)習(xí)開發(fā)者和倡導(dǎo)者,居住于德國(guó)杜塞爾多夫。Antje是“Women in Big Data”杜塞爾多夫分部的聯(lián)合創(chuàng)始人,她頻繁在全世界的AI和機(jī)器學(xué)習(xí)會(huì)議和聚會(huì)上演講。她同時(shí)也任職于O’Reilly AI Superstream大會(huì)并策劃內(nèi)容。

圖書目錄

目錄
前言 . 1
第1 章 基于AWS 的數(shù)據(jù)科學(xué)概述 . 9
1.1 云計(jì)算的益處 9
1.2 數(shù)據(jù)科學(xué)流水線與工作流 12
1.3 機(jī)器學(xué)習(xí)運(yùn)維最佳實(shí)踐 15
1.4 使用Amazon SageMaker 實(shí)現(xiàn)Amazon 人工智能服務(wù)和機(jī)器學(xué)習(xí)
自動(dòng)化 19
1.5 在AWS 上實(shí)現(xiàn)數(shù)據(jù)接入、探索與準(zhǔn)備21
1.6 使用Amazon SageMaker 訓(xùn)練和調(diào)試模型 .27
1.7 使用Amazon SageMaker 和AWS Lambda 函數(shù)部署模型 30
1.8 AWS 上的流分析和機(jī)器學(xué)習(xí) 31
1.9 AWS 基礎(chǔ)設(shè)施和定制化硬件 32
1.10 使用標(biāo)簽、預(yù)算和告警減少開銷 .36
1.11 小結(jié) .36
第2 章 數(shù)據(jù)科學(xué)的應(yīng)用場(chǎng)景 39
2.1 在每個(gè)行業(yè)實(shí)現(xiàn)創(chuàng)新 .39
2.2 個(gè)性化產(chǎn)品推薦 40
2.3 使用Amazon Rekognition 檢測(cè)不當(dāng)視頻 47
2.4 需求預(yù)測(cè) 49
2.5 使用Amazon Fraud Detector 識(shí)別虛假賬號(hào) 53
2.6 使用Amazon Macie 檢測(cè)隱私泄漏 54
2.7 對(duì)話裝置和語(yǔ)音助手 .56
2.8 文本分析和自然語(yǔ)言處理 56
2.9 認(rèn)知式搜索和自然語(yǔ)言理解 62
2.10 智能客戶支持中心 63
2.11 工業(yè)人工智能服務(wù)和預(yù)測(cè)性維護(hù) 64
2.12 使用AWS IoT 和Amazon SageMaker 實(shí)現(xiàn)家庭自動(dòng)化 65
2.13 從醫(yī)療衛(wèi)生檔案中提取醫(yī)療信息 .66
2.14 自我優(yōu)化的智能云基礎(chǔ)設(shè)施 67
2.15 認(rèn)知式的預(yù)測(cè)性商業(yè)智能 .69
2.16 培養(yǎng)下一代人工智能和機(jī)器學(xué)習(xí)開發(fā)者 73
2.17 使用量子計(jì)算實(shí)現(xiàn)大自然的操作系統(tǒng) 78
2.18 提升性能并節(jié)省開支 83
2.19 小結(jié) .85
第3 章 自動(dòng)化機(jī)器學(xué)習(xí) 87
3.1 用SageMaker Autopilot 實(shí)現(xiàn)自動(dòng)化機(jī)器學(xué)習(xí) 88
3.2 用SageMaker Autopilot 跟蹤實(shí)驗(yàn) 90
3.3 用SageMaker Autopilot 訓(xùn)練并部署文本分類器 .90
3.4 用Amazon Comprehend 實(shí)現(xiàn)自動(dòng)化機(jī)器學(xué)習(xí) 105
3.5 小結(jié) .109
第4 章 將數(shù)據(jù)接入云 111
4.1 數(shù)據(jù)湖 112
4.2 用Amazon Athena 查詢Amazon S3 數(shù)據(jù)湖 119
4.3 用AWS Glue Crawler 持續(xù)接入新數(shù)據(jù) .125
4.4 用Amazon Redshift Spectrum 構(gòu)建數(shù)據(jù)湖倉(cāng) .127
4.5 在Amazon Athena 和Amazon Redshift 之間選擇 135
4.6 降低開銷并提升性能 135
4.7 小結(jié) .143
第5 章 探索數(shù)據(jù)集 145
5.1 AWS 上可用于瀏覽數(shù)據(jù)的工具 .146
5.2 使用 SageMaker Studio 可視化數(shù)據(jù)湖 147
5.3 查詢數(shù)據(jù)倉(cāng)庫(kù) .161
5.4 使用Amazon QuickSight 創(chuàng)建數(shù)據(jù)儀表170
5.5 使用Amazon SageMaker 和Apache Spark 檢測(cè)數(shù)據(jù)質(zhì)量問題 .171
5.6 數(shù)據(jù)集的偏差檢測(cè) 179
5.7 使用 SageMaker Clarify 檢測(cè)不同類別的數(shù)據(jù)偏移問題 188
5.8 使用AWS Glue DataBrew 分析數(shù)據(jù) 189
5.9 節(jié)省開支并提升性能 191
5.10 小結(jié) 194
第6 章 為模型訓(xùn)練準(zhǔn)備數(shù)據(jù)集 195
6.1 特征選擇和特征工程 195
6.2 使用 SageMaker 處理任務(wù)進(jìn)行規(guī)模化特征工程 210
6.3 通過 SageMaker 特征存儲(chǔ)(Feature Store)共享特征 218
6.4 使用 SageMaker Data Wrangler 接入并轉(zhuǎn)換數(shù)據(jù) .222
6.5 使用Amazon SageMaker 追蹤構(gòu)件和實(shí)驗(yàn)譜系 223
6.6 使用 AWS Glue DataBrew 接入并轉(zhuǎn)換數(shù)據(jù) 228
6.7 小結(jié) .231
第7 章 訓(xùn)練第一個(gè)模型 . 233
7.1 理解SageMaker 基礎(chǔ)設(shè)施 233
7.2 使用SageMaker JumpStart 部署預(yù)先訓(xùn)練的BERT 模型 238
7.3 開發(fā)一個(gè)SageMaker 模型 240
7.4 自然語(yǔ)言處理簡(jiǎn)史 242
7.5 BERT 轉(zhuǎn)換器架構(gòu) .245
7.6 從頭訓(xùn)練 BERT .247
7.7 微調(diào)預(yù)先訓(xùn)練的 BERT 模型 249
7.8 創(chuàng)建訓(xùn)練腳本 .253
7.9 從SageMaker 筆記本啟動(dòng)訓(xùn)練腳本 260
7.10 評(píng)估模型 .267
7.11 使用SageMaker 調(diào)試器調(diào)試和剖析模型訓(xùn)練 272
7.12 闡述和解釋模型預(yù)測(cè) 278
7.13 檢測(cè)模型偏差并解釋預(yù)測(cè) 284
7.14 BERT 的更多訓(xùn)練選項(xiàng) 290
7.15 節(jié)省開支并提升性能 300
7.16 小結(jié) 306
第8 章 規(guī)?;?xùn)練與優(yōu)化模型 307
8.1 自動(dòng)發(fā)現(xiàn)模型的最優(yōu)超參數(shù) 307
8.2 對(duì)額外的 SageMaker 超參數(shù)調(diào)優(yōu)任務(wù)應(yīng)用熱啟動(dòng) 315
8.3 使用SageMaker 分布式訓(xùn)練擴(kuò)大訓(xùn)練規(guī)模 .319
8.4 節(jié)省開支并提升性能 327
8.5 小結(jié) .331
第9 章 部署模型到生產(chǎn)環(huán)境 . 333
9.1 選擇實(shí)時(shí)預(yù)測(cè)或批量預(yù)測(cè) .333
9.2 使用 SageMaker Endpoints 進(jìn)行實(shí)時(shí)預(yù)測(cè) 335
9.3 使用Amazon CloudWatch 控制 SageMaker Endpoints 自動(dòng)伸縮 .343
9.4 部署新模型與更新模型的策略 348
9.5 測(cè)試與比較新模型 352
9.6 模型性能監(jiān)控與漂移檢測(cè) .364
9.7 監(jiān)控已部署的 SageMaker Endpoints 數(shù)據(jù)質(zhì)量 .368
9.8 監(jiān)控已部署的 SageMaker Endpoints 模型質(zhì)量 .374
9.9 監(jiān)控已部署的 SageMaker Endpoints 偏差漂移 .379
9.10 監(jiān)控已部署的SageMaker Endpoints 特征歸因(Feature Attribution)
漂移 382
9.11 使用SageMaker 批量轉(zhuǎn)換進(jìn)行批量預(yù)測(cè) 385
9.12 AWS Lambda 函數(shù)與Amazon API 網(wǎng)關(guān) .391
9.13 優(yōu)化和管理邊緣模型 392
9.14 使用TorchServe 部署PyTorch 模型 .392
9.15 使用AWS Deep Java 庫(kù)進(jìn)行TensorFlow-BERT 推理 .395
9.16 節(jié)省開支并提升性能 397
9.17 小結(jié) 403
第10 章 流水線和機(jī)器學(xué)習(xí)運(yùn)維 . 405
10.1 機(jī)器學(xué)習(xí)運(yùn)維 405
10.2 軟件流水線 407
10.3 機(jī)器學(xué)習(xí)流水線 408
10.4 使用SageMaker 流水線進(jìn)行流水線編排 412
10.5 使用SageMaker 流水線實(shí)現(xiàn)自動(dòng)化 .424
10.6 更多流水線選項(xiàng) 429
10.7 人機(jī)回圈工作流 439
10.8 節(jié)省開支并提升性能 445
10.9 小結(jié) 447
第11 章 流分析與機(jī)器學(xué)習(xí) 449
11.1 在線學(xué)習(xí)與離線學(xué)習(xí) 450
11.2 流應(yīng)用 450
11.3 對(duì)流數(shù)據(jù)實(shí)現(xiàn)窗口查詢451
11.4 AWS 上的流分析和機(jī)器學(xué)習(xí) 455
11.5 使用Amazon Kinesis,AWS Lambda 和Amazon SageMaker 進(jìn)行
實(shí)時(shí)產(chǎn)品評(píng)價(jià)分類 .457
11.6 使用Amazon Kinesis Data Firehose 實(shí)現(xiàn)流數(shù)據(jù)接入 .458
11.7 使用流分析匯總實(shí)時(shí)產(chǎn)品評(píng)價(jià) 463
11.8 設(shè)置Amazon Kinesis 數(shù)據(jù)分析 464
11.9 Amazon Kinesis 數(shù)據(jù)分析應(yīng)用 473
11.10 使用Apache Kafka, AWS Lambda 和Amazon SageMaker 進(jìn)行
產(chǎn)品評(píng)價(jià)分類 480
11.11 節(jié)省開支并提升性能 .482
11.12 小結(jié) 484
第12 章 用AWS 保證數(shù)據(jù)科學(xué)安全 485
12.1 AWS 與客戶的責(zé)任共擔(dān)模型485
12.2 應(yīng)用 AWS 身份和訪問管理(IAM) 486
12.3 隔離計(jì)算和網(wǎng)絡(luò)環(huán)境 495
12.4 安全訪問Amazon S3 的數(shù)據(jù) 498
12.5 數(shù)據(jù)靜態(tài)加密 507
12.6 數(shù)據(jù)傳輸加密 511
12.7 安全使用 SageMaker Notebook 實(shí)例 .513
12.8 安全使用 SageMaker Studio .515
12.9 安全運(yùn)行SageMaker 任務(wù)和模型 517
12.10 安全使用 AWS Lake Formation 522
12.11 通過 AWS 加密信息管理服務(wù)安全使用數(shù)據(jù)庫(kù)憑據(jù) 522
12.12 治理 523
12.13 可審計(jì)性 527
12.14 節(jié)省開支并提升性能 .528
12.15 小結(jié) 530

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)