注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)人工智能新一代人工智能與語音識別

新一代人工智能與語音識別

新一代人工智能與語音識別

定 價:¥44.50

作 者: 馬延周 著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302523840 出版時間: 2019-07-01 包裝: 平裝
開本: 16 頁數(shù): 145 字數(shù):  

內(nèi)容簡介

  本書系統(tǒng)介紹基于新聞?wù)Z料的俄語連續(xù)語音識別方法。全書共分以下幾個部分:基于Kaldi設(shè)計實現(xiàn)俄語連續(xù)語音識別原型系統(tǒng),使之具備在線識別和離線識別功能,以驗證聲學模型和語言模型優(yōu)化算法的有效性,進而為面向特定領(lǐng)域的俄語語音識別實用系統(tǒng)研發(fā)提供理論方法、實驗數(shù)據(jù)和關(guān)鍵技術(shù)支撐。為了實現(xiàn)上述目標,需要進行如下環(huán)環(huán)緊扣的操作步驟:俄語語音語料的采集加工處理、俄語文本語料的采集清洗過濾、俄語發(fā)音詞典的自動預測生成、聲學模型建模基本單元(音素集)的確定、聲學模型和語言模型的優(yōu)化等。

作者簡介

  馬延周,男,戰(zhàn)略支援部隊信息工程大學洛陽校區(qū),副教授,博士研究生 1996-2000,解放軍信息工程大學學員,計算機應(yīng)用專業(yè) 2000-2005,解放軍外國語學院基礎(chǔ)部講師 2005-2008,解放軍信息工程大學碩士研究生,計算機技術(shù)應(yīng)用 2008-2012,解放軍外國語學院基礎(chǔ)部講師 2012-2016,解放軍外國語學院博士研究生,語言信息處理(語音識別) 2013-2015,中國科學技術(shù)大學、科大訊飛研究院訪學,主要研究連續(xù)語音識別 2016-,解放軍信息工程大學洛陽校區(qū)(原解放軍外國語學院)副教授 從教18年來,主要承擔計算機類、語言信息類本碩博課程的主講與輔導任務(wù),主持或參與的g家級、省部級、院校級各類項目17余項是,主編或參編的教材4部??蒲谐晒饕性诙嗾Z種的信息處理(如語音識別、關(guān)鍵詞識別、聲紋識別等領(lǐng)域)及多語種語料的采集處理等領(lǐng)域。 2016年博士論文獲解放軍外國語學院優(yōu)秀博士論文,排名第1。 2017年申報河南省優(yōu)秀博士論文,2018年4月獲批河南省優(yōu)秀博士論文(當年,全省15篇優(yōu)秀博士論文)。

圖書目錄

目錄
第0章緒論1
0.1研究依據(jù)1
0.2研究對象與研究目標2
0.3研究方法3
0.4研究意義3
0.5本書的創(chuàng)新點4
0.6語料來源4
0.7本書的結(jié)構(gòu)5
第1章語音識別技術(shù)研究綜述7
1.1語音識別的定義與分類7
1.1.1語音識別的定義7
1.1.2語音識別的分類8
1.2語音識別技術(shù)的研究進展9
1.2.1語音識別技術(shù)的發(fā)展概況9
1.2.2國外俄語語音識別技術(shù)的研究進展10
1.2.3中國俄語語音識別技術(shù)的研究進展13
1.3語音識別系統(tǒng)的基本原理14
1.3.1特征提取15
1.3.2聲學模型16
1.3.3語言模型17
1.3.4解碼18
1.4語音識別技術(shù)研究所關(guān)注的關(guān)鍵問題19
本章小結(jié)21〖4〗新一代人工智能與語音識別〖2〗目錄〖4〗第2章語音數(shù)據(jù)的加工處理22
2.1問題描述22
2.2眾包的定義及內(nèi)涵23
2.2.1眾包的基本概念23
2.2.2眾包的基本流程24
2.2.3眾包的關(guān)鍵問題24
2.3解決方案25
2.3.1質(zhì)量控制25
2.3.2語音標注平臺的架構(gòu)27
2.3.3標注平臺的設(shè)計與實現(xiàn)28
2.4語音標注31
2.4.1語音有效性判斷31
2.4.2語音轉(zhuǎn)寫規(guī)范32
2.4.3語音標注規(guī)范32
2.5實驗設(shè)計與結(jié)果分析33
2.5.1實驗設(shè)計33
2.5.2結(jié)果分析34
2.5.3結(jié)論36
本章小結(jié)36
第3章俄語聲學模型的建立37
3.1連續(xù)語音識別37
3.1.1連續(xù)語音識別的整體模型38
3.1.2聲學模型訓練的HMMGMM方法40
3.1.3聲學模型訓練中的HMMDNN方法48
3.2俄語語音學概述52
3.2.1俄語的使用及分布情況52
3.2.2俄語語音的基本特點55
3.2.3俄語音素的發(fā)音特征56
3.2.4俄語元音音素的隨位變化58
3.2.5俄語輔音音素的隨位變化60
3.3俄語聲學單元的選擇61
3.3.1俄語SAMPA音素集61
3.3.2俄語音系表64
3.4實驗設(shè)計與結(jié)果分析64
3.4.1實驗設(shè)計65
3.4.2結(jié)果分析66
本章小結(jié)67
第4章俄語語言模型的建立68
4.1文本語料的準備與清洗68
4.1.1數(shù)據(jù)來源的篩選69
4.1.2數(shù)據(jù)爬取71
4.1.3數(shù)據(jù)的去重與清洗71
4.1.4格式化處理74
4.2語言模型簡述75
4.2.1語言模型的平滑技術(shù)77
4.2.2語言模型的剪枝算法81
4.3語言模型的訓練流程84
4.3.1語言模型的訓練實現(xiàn)84
4.3.2詞典的選擇85
4.3.3LM的剪枝與優(yōu)化87
4.4實驗結(jié)果分析89
4.4.1詞典規(guī)模測試89
4.4.2語料規(guī)模測試89
4.4.3語言模型剪枝測試90
本章小結(jié)91
第5章基于Kaldi的俄語語音識別原型系統(tǒng)92
5.1系統(tǒng)設(shè)計的目標與原則92
5.1.1系統(tǒng)設(shè)計的目標92
5.1.2系統(tǒng)設(shè)計的原則92
5.2系統(tǒng)的開發(fā)環(huán)境與整體架構(gòu)93
5.2.1系統(tǒng)的開發(fā)環(huán)境93
5.2.2系統(tǒng)的整體架構(gòu)93
5.3Kaldi環(huán)境的搭建94
5.3.1Kaldi及實驗環(huán)境94
5.3.2Kaldi訓練服務(wù)器的搭建96
5.3.3AM訓練數(shù)據(jù)及參數(shù)設(shè)置98
5.3.4LM訓練數(shù)據(jù)及參數(shù)設(shè)置107
5.4Kaldi訓練優(yōu)化111
5.4.1Kaldi聲學建模111
5.4.2GPU加速113
5.5語音識別原型系統(tǒng)的設(shè)計114
5.5.1系統(tǒng)GUI的設(shè)計114
5.5.2在線識別功能114
5.5.3離線識別功能117
5.6實驗設(shè)計與結(jié)果分析119
5.6.1實驗設(shè)計119
5.6.2實驗結(jié)果119
5.6.3結(jié)果分析120
本章小結(jié)121
第6章總結(jié)與展望122
6.1本書的主要成果122
6.2未來的研究計劃123
附錄A英漢術(shù)語對照表124
附錄B其他相關(guān)資料126
B.1俄語發(fā)音詞典(76277個詞形)示例126
B.2俄語解碼詞表(189971個詞形)示例127
B.3俄語字符Unicode編碼對照表128
B.4俄語語音格式化程序(轉(zhuǎn)換為16KB、16b)128
B.5俄語文本轉(zhuǎn)Unicode編碼程序129
B.6從https: //twitter.com網(wǎng)站上下載的部分網(wǎng)頁文件
(json格式)示例131
B.7從http: //www.interfax.ru網(wǎng)站上下載的部分網(wǎng)頁
文件(json格式)示例131
B.8俄語拉丁字母轉(zhuǎn)寫表132
參考文獻134

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號