注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)軟件工程及軟件方法學復雜環(huán)境下語音信號處理的深度學習方法

復雜環(huán)境下語音信號處理的深度學習方法

復雜環(huán)境下語音信號處理的深度學習方法

定 價:¥168.00

作 者: 張曉雷 著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787302590002 出版時間: 2022-01-01 包裝:
開本: 頁數(shù): 字數(shù):  

內(nèi)容簡介

  語音降噪處理是信號處理的重要分支領(lǐng)域。近年來,該領(lǐng)域在人工智能與深度學習技術(shù)的驅(qū)動下取得了突破性進展。《復雜環(huán)境下語音信號處理的深度學習方法》系統(tǒng)總結(jié)語音降噪處理的深度學習方法,盡可能涵蓋該方法的前沿進展。全書共分8章。第1章是緒論;第2章介紹深度學習的基礎(chǔ)知識和常見的深度網(wǎng)絡(luò)模型;第3~6章集中介紹基于深度學習的語音降噪處理前端算法,其中,第3章介紹語音檢測,第4章介紹單通道語音增強,第5章介紹多通道語音增強,第6章介紹多說話人語音分離;第7章和第8章分別介紹基于深度學習的語音降噪處理在聲紋識別和語音識別方面的應用,其中著重介紹基于深度學習的現(xiàn)代聲紋識別、語音識別基礎(chǔ)和前沿進展。《復雜環(huán)境下語音信號處理的深度學習方法》專業(yè)性較強,主要面向具備一定語音信號處理和機器學習基礎(chǔ)、致力于從事智能語音處理相關(guān)工作的高年級本科生、研究生和專業(yè)技術(shù)人員。

作者簡介

  張曉雷,西北工業(yè)大學教授,博士生導師。清華大學博士,美國俄亥俄州立大學博士后。入選國家與省部級青年人才計劃。主要從事語音信號處理、機器學習、人工智能的研究工作。在Neural Networks、IEEE TPAMI、IEEE TASLP、IEEE TCYB、Computer Speech and Language等國際期刊和會議發(fā)表論文六十余篇。出版專著和譯著各一部。主持國家和省部級項目十余項。獲授權(quán)發(fā)明專利十余項。曾獲國際神經(jīng)網(wǎng)絡(luò)學會與Neural Networks期刊2020年度論文獎、亞太信號與信息處理學會杰出講者、北京市科學技術(shù)一等獎等獎項。研究成果成功應用于國內(nèi)三大電信運營商和金融、交通、保險等行業(yè)的二十余家主流企業(yè)。擔任Neural Networks、IEEE TASLP、EURASIP Journal on Audio, Speech,and Music Processing等國際期刊的編委,IEEE信號處理學會語音與語言技術(shù)委員會委員,中國人工智能學會模式識別專業(yè)委員會委員,中國計算機學會語音對話與聽覺專業(yè)委員會委員。

圖書目錄

第1章 緒論
第2章 深度學習基礎(chǔ)
2.1 有監(jiān)督學習
2.2 單層神經(jīng)網(wǎng)絡(luò)
2.2.1 基本模型
2.2.2 激活函數(shù)
2.3 前饋深度神經(jīng)網(wǎng)絡(luò)
2.3.1 反向傳播算法
2.3.2 正則化
2.4 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.1 循環(huán)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
2.4.2 長短時記憶網(wǎng)絡(luò)
2.4.3 門控循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.4 深層RNN結(jié)構(gòu)
2.4.5 序列數(shù)據(jù)的RNN建??蚣?br />2.5 卷積神經(jīng)網(wǎng)絡(luò)
2.5.1 卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
2.5.2 其他卷積形式
2.5.3 殘差神經(jīng)網(wǎng)絡(luò)
2.5.4 時序卷積網(wǎng)絡(luò)
2.6 神經(jīng)網(wǎng)絡(luò)中的歸-化
2.6.1 批歸-化
2.6.2 層歸-化
2.7 神經(jīng)網(wǎng)絡(luò)中的注意力機制
2.7.1 編碼器-解碼器框架
2.7.2 編碼器,注意力機制一解碼器框架
2.7.3 單調(diào)注意力機制
2.7.4 Transformer
2.8 生成對抗網(wǎng)絡(luò)
2.8.1 基本結(jié)構(gòu)
2.8.2 模型訓練
2.9 本章小結(jié)
第3章 語音檢測
3.1 引言
3.2 基本知識
3.2.1 信號模型
3.2.2 評價指標
3.3 語音檢測模型
3.3.1 語音檢測模型的基本框架
3.3.2 基于深度置信網(wǎng)絡(luò)的語音檢測
3.3.3 基于降噪深度神經(jīng)網(wǎng)絡(luò)的語音檢測
3.3.4 基于多分辨率堆棧的語音檢測模型框架
3.4 語音檢測模型的損失函數(shù)
3.4.1 最小化交叉熵
3.4.2 最小均方誤差
3.4.3 最大化ROC曲線下面積
3.5 語音檢測的聲學特征
3.5.1 短時傅里葉變換的頻帶選擇
3.5.2 多分辨率類耳蝸頻譜特征
3.6 模型的泛化能力
3.7 本章小結(jié)
第4章 單通道語音增強
4.1 引言
4.2 基本知識
4.2.1 信號模型
4.2.2 評價指標
4.3 頻域語音增強
……
第5章 多通道語音增強
第6章 多說話人語音分離
第7章 聲紋識別
第8章 語音識別
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號