注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)操作系統(tǒng)其他操作系統(tǒng)計(jì)算機(jī)視覺:飛槳深度學(xué)習(xí)實(shí)戰(zhàn)

計(jì)算機(jī)視覺:飛槳深度學(xué)習(xí)實(shí)戰(zhàn)

計(jì)算機(jī)視覺:飛槳深度學(xué)習(xí)實(shí)戰(zhàn)

定 價(jià):¥69.80

作 者: 深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心 百度技術(shù)培訓(xùn)中心 組編 羅曉燕 白浩杰 黨青青 杜宇寧 張寶昌 編著
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302623762 出版時(shí)間: 2023-04-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書在介紹深度學(xué)習(xí)、百度飛槳等相關(guān)知識(shí)的基礎(chǔ)上,著重介紹了圖像分類、目標(biāo)檢測(cè)、語義分割、人體關(guān)鍵點(diǎn)檢測(cè)、圖像生成、視頻分類、圖像文本檢測(cè)和識(shí)別、圖像識(shí)別等計(jì)算機(jī)視覺任務(wù)的實(shí)現(xiàn)原理及深度學(xué)習(xí)模型框架,并通過具體案例來詳細(xì)介紹各任務(wù)的實(shí)現(xiàn)細(xì)節(jié)。 全書分為理論篇和實(shí)戰(zhàn)篇。理論篇(第1~4章)梳理了計(jì)算機(jī)視覺技術(shù)的發(fā)展歷程、主要任務(wù)、行業(yè)應(yīng)用系統(tǒng),同時(shí)簡要介紹了深度學(xué)習(xí)開發(fā)框架、飛槳(PaddlePaddle)開發(fā)平臺(tái),以及深度學(xué)習(xí)的基礎(chǔ)知識(shí)與網(wǎng)絡(luò)模型架構(gòu)。實(shí)戰(zhàn)篇(第5~12章)結(jié)合計(jì)算機(jī)視覺的各個(gè)任務(wù)要求與技術(shù)發(fā)展,對(duì)其中經(jīng)典的深度學(xué)習(xí)算法模型進(jìn)行介紹。全書提供了實(shí)例代碼,詳解了在飛槳開發(fā)框架下各任務(wù)的模型實(shí)現(xiàn)過程。 本書適合作為高等院校人工智能、計(jì)算機(jī)視覺專業(yè)高年級(jí)本科生、研究生的教材,同時(shí)可作為計(jì)算機(jī)視覺相關(guān)任務(wù)實(shí)踐教程,也可以作為科研工作者的參考書籍。

作者簡介

暫缺《計(jì)算機(jī)視覺:飛槳深度學(xué)習(xí)實(shí)戰(zhàn)》作者簡介

圖書目錄

理論篇
第1章計(jì)算機(jī)視覺概述
1.1計(jì)算機(jī)視覺技術(shù)的發(fā)展
1.2計(jì)算機(jī)視覺任務(wù)概述
1.2.1計(jì)算機(jī)視覺經(jīng)典任務(wù)
1.2.2計(jì)算機(jī)視覺常見任務(wù)
1.3計(jì)算機(jī)視覺處理應(yīng)用系統(tǒng)
1.3.1計(jì)算機(jī)視覺行業(yè)產(chǎn)業(yè)鏈
1.3.2計(jì)算機(jī)視覺行業(yè)應(yīng)用系統(tǒng)
1.4計(jì)算機(jī)視覺處理常用工具
1.4.1OpenCV簡介
1.4.2OpenCVPython
1.4.3OpenCV的基礎(chǔ)模塊
1.4.4其他CV常用工具
1.5本章小結(jié)
參考文獻(xiàn)
第2章深度學(xué)習(xí)開發(fā)框架
2.1常見的深度學(xué)習(xí)開發(fā)框架
2.1.1TensorFlow深度學(xué)習(xí)開發(fā)框架
2.1.2PyTorch深度學(xué)習(xí)開發(fā)框架
2.1.3PaddlePaddle深度學(xué)習(xí)開發(fā)框架
2.2飛槳基礎(chǔ)
2.2.1開發(fā)環(huán)境
2.2.2開發(fā)套件
2.2.3工具組件
2.2.4開發(fā)平臺(tái)
2.3本章小結(jié)
參考文獻(xiàn)
 
 
第3章深度學(xué)習(xí)算法基礎(chǔ)
3.1機(jī)器學(xué)習(xí)
3.2神經(jīng)網(wǎng)絡(luò)的基本組成
3.2.1神經(jīng)元
3.2.2神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
3.3神經(jīng)網(wǎng)絡(luò)的計(jì)算
3.3.1激活函數(shù)
3.3.2正向傳播
3.3.3反向傳播
3.3.4優(yōu)化算法
3.4卷積神經(jīng)網(wǎng)絡(luò)的基本組成
3.4.1卷積層
3.4.2池化層
3.4.3ReLU激活函數(shù)
3.4.4全連接層
3.5深度學(xué)習(xí)模型的訓(xùn)練技巧
3.5.1歸一化
3.5.2丟棄法
3.5.3權(quán)重衰減
3.5.4參數(shù)初始化
3.6本章小結(jié)
參考文獻(xiàn)
第4章深度學(xué)習(xí)網(wǎng)絡(luò)模型
4.1深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)
4.2代表性的網(wǎng)絡(luò)模型
4.2.1卷積神經(jīng)網(wǎng)絡(luò)模型
4.2.2循環(huán)神經(jīng)網(wǎng)絡(luò)模型
4.2.3Transformer網(wǎng)絡(luò)模型
4.2.4復(fù)雜MLP網(wǎng)絡(luò)模型
4.3網(wǎng)絡(luò)搭建案例
4.3.1環(huán)境準(zhǔn)備
4.3.2數(shù)據(jù)準(zhǔn)備
4.3.3模型構(gòu)建
4.3.4模型訓(xùn)練與驗(yàn)證
4.3.5模型可視化
4.4本章小結(jié)
參考文獻(xiàn)
實(shí)戰(zhàn)篇
第5章圖像分類算法原理與實(shí)戰(zhàn)
5.1圖像分類任務(wù)的基本介紹
5.1.1圖像分類技術(shù)的發(fā)展
5.1.2圖像分類的評(píng)價(jià)指標(biāo)
5.2基于殘差的網(wǎng)絡(luò)
5.2.1ResNet模型
5.2.2DenseNet模型
5.2.3DPN模型
5.3基于Transformer的網(wǎng)絡(luò)
5.3.1ViT模型
5.3.2SwinTransformer模型
5.4輕量化的網(wǎng)絡(luò)
5.4.1MobileNet模型
5.4.2PPLCNet模型
5.5飛槳實(shí)現(xiàn)圖像分類案例
5.5.1環(huán)境安裝與配置
5.5.2數(shù)據(jù)準(zhǔn)備
5.5.3模型構(gòu)建
5.5.4模型訓(xùn)練
5.5.5模型預(yù)測(cè)
5.6本章小結(jié)
參考文獻(xiàn)
第6章目標(biāo)檢測(cè)算法原理與實(shí)戰(zhàn)
6.1目標(biāo)檢測(cè)任務(wù)基本介紹
6.1.1目標(biāo)檢測(cè)技術(shù)的發(fā)展
6.1.2目標(biāo)檢測(cè)的評(píng)價(jià)指標(biāo)
6.2Faster RCNN基本解析
6.2.1RCNN系列
6.2.2Faster RCNN整體架構(gòu)
6.2.3Faster RCNN主要特點(diǎn)
6.3SSD基本解析
6.3.1SSD基本架構(gòu)
6.3.2SSD主要特點(diǎn)
6.4YOLOv3基本解析
6.4.1YOLO系列
6.4.2YOLOv3主要特點(diǎn)
6.5FCOS基本解析
6.5.1FCOS基本架構(gòu)
6.5.2FCOS主要特點(diǎn)
6.5.3損失函數(shù)的設(shè)計(jì)
6.5.4FCOS的優(yōu)缺點(diǎn)
6.6DETR基本解析
6.6.1DETR基本結(jié)構(gòu)
6.6.2DETR主要特點(diǎn)
6.7飛槳實(shí)現(xiàn)目標(biāo)檢測(cè)案例
6.7.1環(huán)境準(zhǔn)備
6.7.2數(shù)據(jù)讀取與增強(qiáng)
6.7.3模型構(gòu)建
6.7.4模型訓(xùn)練
6.7.5模型測(cè)試與可視化
6.8本章小結(jié)
參考文獻(xiàn)
第7章語義分割算法原理與實(shí)戰(zhàn)
7.1語義分割任務(wù)的基本介紹
7.1.1語義分割的發(fā)展
7.1.2語義分割的評(píng)價(jià)指標(biāo)
7.2深度學(xué)習(xí)語義分割基礎(chǔ)網(wǎng)絡(luò)
7.2.1FCN模型
7.2.2SegNet模型
7.2.3UNet模型
7.3語義分割網(wǎng)絡(luò)的系列改進(jìn)
7.3.1空洞可分離卷積: DeepLabv3
7.3.2低層細(xì)節(jié)信息保留: RefineNet
7.3.3全局語義特征聚合: OCRNet
7.4飛槳實(shí)現(xiàn)語義分割案例
7.4.1環(huán)境準(zhǔn)備
7.4.2數(shù)據(jù)準(zhǔn)備與預(yù)處理
7.4.3模型構(gòu)建
7.4.4模型訓(xùn)練
7.4.5模型驗(yàn)證與評(píng)估
7.5本章小結(jié)
參考文獻(xiàn)
第8章人體關(guān)鍵點(diǎn)檢測(cè)原理與實(shí)戰(zhàn)
8.1人體關(guān)鍵點(diǎn)檢測(cè)任務(wù)的基本介紹
8.1.1人體關(guān)鍵點(diǎn)檢測(cè)的發(fā)展
8.1.2人體關(guān)鍵點(diǎn)檢測(cè)的評(píng)價(jià)指標(biāo)
8.2人體關(guān)鍵點(diǎn)檢測(cè)的經(jīng)典方法
8.2.1模板匹配
8.2.2貝葉斯估計(jì)
8.3多尺度人體姿態(tài)檢測(cè)方法
8.3.1Hourglass模型架構(gòu)
8.3.2一階Hourglass模塊
8.3.3多階Hourglass網(wǎng)絡(luò)
8.4高分辨率人體姿態(tài)估計(jì)方法
8.4.1HRNet模型
8.4.2HigherHRNet 模型
8.5人體姿態(tài)識(shí)別OpenPose
8.5.1卷積姿態(tài)機(jī)CPM
8.5.2OpenPose架構(gòu)
8.6飛槳實(shí)現(xiàn)人體關(guān)鍵點(diǎn)檢測(cè)案例
8.6.1環(huán)境準(zhǔn)備
8.6.2數(shù)據(jù)集準(zhǔn)備
8.6.3模塊導(dǎo)入
8.6.4數(shù)據(jù)集定義
8.6.5模型構(gòu)建
8.6.6損失函數(shù)定義
8.6.7模型訓(xùn)練
8.6.8模型預(yù)測(cè)
8.7本章小結(jié)
參考文獻(xiàn)
第9章圖像生成算法原理與實(shí)戰(zhàn)
9.1圖像生成任務(wù)的基本介紹
9.1.1圖像生成應(yīng)用與發(fā)展
9.1.2圖像生成的評(píng)價(jià)指標(biāo)
9.2基于圖像生成的圖像轉(zhuǎn)換: Pix2Pix 
9.3基于圖像生成的風(fēng)格遷移: CycleGAN
9.3.1CycleGAN的網(wǎng)絡(luò)結(jié)構(gòu)
9.3.2CycleGAN的循環(huán)訓(xùn)練流程
9.4基于圖像生成算法的圖像屬性控制: StyleGAN
9.4.1StyleGANv1的網(wǎng)絡(luò)結(jié)構(gòu)與訓(xùn)練技巧
9.4.2StyleGANv1對(duì)隱空間耦合度的量化
9.4.3StyleGANv2的改進(jìn)
9.5飛槳實(shí)現(xiàn)圖像生成案例
9.5.1環(huán)境準(zhǔn)備
9.5.2數(shù)據(jù)讀取與預(yù)處理
9.5.3模型構(gòu)建
9.5.4模型訓(xùn)練
9.5.5模型驗(yàn)證與評(píng)估
9.5.6模型測(cè)試
9.6本章小結(jié)
參考文獻(xiàn)
第10章視頻分類原理與實(shí)戰(zhàn)
10.1視頻分類任務(wù)的基本介紹
10.1.1視頻分類的應(yīng)用與發(fā)展
10.1.2視頻分類任務(wù)的評(píng)價(jià)指標(biāo)
10.2基于時(shí)序劃分的雙流網(wǎng)絡(luò)
10.2.1TSN模型
10.2.2SlowFast模型
10.3基于時(shí)序移位的類3D網(wǎng)絡(luò): TSM
10.3.1類3D思想
10.3.2網(wǎng)絡(luò)設(shè)計(jì)
10.4基于自注意力機(jī)制的網(wǎng)絡(luò)
10.4.1Nonlocal模型
10.4.2TimeSformer模型
10.5飛槳實(shí)現(xiàn)視頻分類案例
10.5.1環(huán)境準(zhǔn)備
10.5.2數(shù)據(jù)讀取與預(yù)處理
10.5.3模型構(gòu)建
10.5.4模型訓(xùn)練
10.5.5模型驗(yàn)證與評(píng)估
10.5.6模型測(cè)試
10.6本章小結(jié)
參考文獻(xiàn)
第11章圖像文本檢測(cè)和識(shí)別原理與實(shí)戰(zhàn)
11.1圖像文本檢測(cè)和識(shí)別任務(wù)的基本介紹
11.1.1OCR任務(wù)的應(yīng)用與發(fā)展
11.1.2OCR任務(wù)的評(píng)價(jià)指標(biāo)
11.2文本檢測(cè)算法
11.2.1小尺度文本檢測(cè)算法: CTPN
11.2.2場(chǎng)景文本檢測(cè)算法: EAST
11.2.3任意形狀文本檢測(cè)器: SAST
11.2.4二值化檢測(cè)模型: DBNet
11.3文本識(shí)別算法
11.3.1基于卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的識(shí)別模型: CRNN
11.3.2基于空間注意力殘差網(wǎng)絡(luò)的識(shí)別模型: STARNet
11.3.3具有自動(dòng)校正功能的魯棒識(shí)別模型: RARE
11.3.4基于語義推理網(wǎng)絡(luò)的識(shí)別模型: SRN
11.4端到端ORC方法
11.4.1FOTS模型
11.4.2PGNet模型
11.5飛槳實(shí)現(xiàn)OCR案例
11.5.1環(huán)境準(zhǔn)備
11.5.2數(shù)據(jù)讀取與預(yù)處理
11.5.3模型構(gòu)建
11.5.4CTC Loss
11.5.5訓(xùn)練配置
11.5.6模型訓(xùn)練
11.5.7驗(yàn)證前準(zhǔn)備
11.5.8開始驗(yàn)證
11.6本章小結(jié)
參考文獻(xiàn)
第12章圖像識(shí)別原理與實(shí)戰(zhàn)
12.1圖像識(shí)別系統(tǒng)任務(wù)流程基本概述
12.1.1圖像識(shí)別任務(wù)基本介紹
12.1.2百度飛槳圖像識(shí)別系統(tǒng)簡介
12.2目標(biāo)檢測(cè)模塊
12.3特征學(xué)習(xí)模塊
12.3.1度量學(xué)習(xí)算法原理及主要內(nèi)容
12.3.2深度度量學(xué)習(xí)常見算法框架
12.3.3百度飛槳中深度度量學(xué)習(xí)應(yīng)用
12.4特征檢索系統(tǒng)
12.4.1特征檢索系統(tǒng)介紹
12.4.2特征檢索原理介紹
12.5飛槳實(shí)現(xiàn)圖像識(shí)別應(yīng)用案例
12.5.1環(huán)境配置
12.5.2已知類別的圖像識(shí)別
12.5.3商品識(shí)別與檢索
12.5.4基于新的索引庫的圖像識(shí)別
12.6本章小結(jié)
參考文獻(xiàn)
 

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)