注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)人工智能聲紋技術(shù):從核心算法到工程實(shí)踐

聲紋技術(shù):從核心算法到工程實(shí)踐

聲紋技術(shù):從核心算法到工程實(shí)踐

定 價(jià):¥99.00

作 者: 王泉 著
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787121395291 出版時(shí)間: 2020-09-01 包裝: 平裝
開本: 16開 頁(yè)數(shù): 292 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  這是第一本系統(tǒng)性地介紹聲紋識(shí)別、聲紋分割聚類及聲紋在語(yǔ)音識(shí)別、語(yǔ)音合成、人聲分離等領(lǐng)域中應(yīng)用的技術(shù)書。本書內(nèi)容全面且緊隨時(shí)代前沿,不僅涵蓋了早至 20世紀(jì) 60 年代的經(jīng)典方法,而且以大量篇幅著重介紹了深度學(xué)習(xí)時(shí)代的新技術(shù)。本書注重理論與實(shí)踐的結(jié)合,除了配備大量實(shí)踐案例與習(xí)題,還有專門章節(jié)介紹聲紋技術(shù)在實(shí)際工程部署方面的諸多課題。 本書面向大學(xué)與研究機(jī)構(gòu)的學(xué)生、教研人員,以及企事業(yè)單位從事聲紋技術(shù)相關(guān)工作的工程師、架構(gòu)師和產(chǎn)品經(jīng)理等。

作者簡(jiǎn)介

  王泉,美國(guó)谷歌公司資深軟件工程師、聲紋識(shí)別與語(yǔ)言識(shí)別團(tuán)隊(duì)主管。作者畢業(yè)于清華大學(xué)自動(dòng)化系,后取得美國(guó)倫斯勒理工學(xué)院計(jì)算機(jī)工程專業(yè)博士學(xué)位,曾在美國(guó)亞馬遜公司參與亞馬遜智能音箱語(yǔ)音助手Alexa的研發(fā)。在谷歌任職期間,作者帶領(lǐng)團(tuán)隊(duì)將先進(jìn)的聲紋技術(shù)部署到了大量產(chǎn)品中,使得谷歌智能音箱成為市面上第一款支持多用戶模式的同類產(chǎn)品。此外,作者在聲紋識(shí)別、聲紋分割聚類、人聲分離、語(yǔ)音檢測(cè)、語(yǔ)言識(shí)別及語(yǔ)音合成等諸多領(lǐng)域擁有大量專利,發(fā)表過多篇重量級(jí)論文,并開創(chuàng)了監(jiān)督式聲紋分割聚類及聲紋定向人聲分離這兩個(gè)新興研究方向。作者的工作曾被VentureBeat、TechCrunch、Engadget、CNET等國(guó)際著名科技媒體專題報(bào)道。

圖書目錄

1 聲紋技術(shù)的前世今生 1
1.1 什么是聲紋1
1.2 最早的聲紋技術(shù)2
1.3 聲紋技術(shù)的發(fā)展 5
1.4 大變革:深度學(xué)習(xí)時(shí)代的來(lái)臨 10
1.5 新的機(jī)遇:智能語(yǔ)音助手的普及 11
2 音頻信號(hào)處理基礎(chǔ) 14
2.1 欲懂聲紋,先學(xué)音頻 14
2.2 聲學(xué)基礎(chǔ)15
2.3 音頻信號(hào)基礎(chǔ)概念 24
2.4 從信號(hào)到特征:短時(shí)分析38
2.5 常用的音頻特征 42
3 聲紋識(shí)別技術(shù) 54
3.1 聲紋識(shí)別:聲紋技術(shù)的核心 54
3.2 聲紋識(shí)別的評(píng)價(jià)指標(biāo) 60
3.3 深度學(xué)習(xí)之前的方法 65
3.4 基于深度學(xué)習(xí)的方法 78
3.5 聲紋識(shí)別中的數(shù)據(jù)處理 102
3.6 聲紋驗(yàn)證 112
3.7 常用數(shù)據(jù)集 115
4 聲紋識(shí)別的工程部署 120
4.1 從模型到產(chǎn)品120
4.2 聲紋識(shí)別常見工程問題 126
4.3 全設(shè)備端部署 139
4.4 全服務(wù)器端部署 144
4.5 復(fù)合式部署 151
5 聲紋分割聚類技術(shù) 156
5.1 分割聚類:更好地理解對(duì)話語(yǔ)音 156
5.2 聲紋分割聚類與多說(shuō)話人識(shí)別 163
5.3 聚類分析 167
5.4 二次分割方法 180
5.5 監(jiān)督式方法 182
5.6 聲紋分割聚類的評(píng)價(jià)指標(biāo) 203
5.7 常用數(shù)據(jù)集 206
6 聲紋技術(shù)的其他應(yīng)用 211
6.1 聲紋的力量 211
6.2 用于語(yǔ)音識(shí)別 212
6.3 用于語(yǔ)音合成 214
6.4 用于語(yǔ)音檢測(cè) 220
6.5 用于人聲分離 221
6.6 聲紋轉(zhuǎn)換 226
6.7 聲紋還原度測(cè)試 227
7 聲紋技術(shù)的未來(lái) 231
7.1 概述 231
7.2 聲紋技術(shù)的挑戰(zhàn) 231
7.3 對(duì)更多數(shù)據(jù)的需求 235
7.4 聲紋技術(shù)的未來(lái)研究方向 238
7.5 結(jié)語(yǔ) 246
中英詞匯對(duì)照 248
參考文獻(xiàn) 259

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)