注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)人工智能人與機器聽覺:聽見聲音的意義

人與機器聽覺:聽見聲音的意義

人與機器聽覺:聽見聲音的意義

定 價:¥169.00

作 者: (美)理查德·F.里昂(Richard F.Lyon)
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111684534 出版時間: 2021-08-01 包裝:
開本: 16開 頁數(shù): 415 字數(shù):  

內(nèi)容簡介

  《人與機器聽覺:聽見聲音的意義》由谷歌首席科學(xué)家Lyon撰寫,是一部關(guān)于聽覺研究的系統(tǒng)性學(xué)術(shù)著作?!度伺c機器聽覺:聽見聲音的意義》中提出利用CARFAC模型模擬耳蝸對聲音信號的分析,利用帶有精細時序結(jié)構(gòu)的SAI表征聽覺神經(jīng)模式,明確反對將耳蝸視作傅里葉頻率分析器的做法?!度伺c機器聽覺:聽見聲音的意義》內(nèi)容系統(tǒng)且全面,涵蓋人類聽覺原理、機器聽覺理論、精密聽覺模型建模和機器聽覺應(yīng)用實例,還包括對聽覺研究史上的標志性人物及事例的介紹?!度伺c機器聽覺:聽見聲音的意義》對數(shù)學(xué)原理的闡釋脈絡(luò)清晰,并配有算法源碼,適合相關(guān)領(lǐng)域的技術(shù)人員和研究人員參考,也適合作為高等院校相關(guān)研究生課程的教材?!度伺c機器聽覺:聽見聲音的意義》構(gòu)建了一套完整的聽覺理論框架,具有鮮明的學(xué)術(shù)觀點和創(chuàng)作特色:創(chuàng)造性地提出利用CARFAC模型模擬耳蝸對聲音信號的分析,利用帶有精細時序結(jié)構(gòu)的SAI表征聽覺神經(jīng)模式,強調(diào)將聽覺模型引入機器聽覺應(yīng)用,反對將耳蝸視作傅里葉頻率分析器的做法。將聽覺系統(tǒng)劃分為四層,在底層聽覺過程模擬的基礎(chǔ)上探索高層信息處理機制并驗證模型的有效性,為遠近場模型等問題的解決以及CASA等技術(shù)的落地提供理論支撐,同時拓展了研究思路。全面涵蓋人類聽覺原理、機器聽覺理論、精密聽覺模型建模方法以及利用機器學(xué)習(xí)方法構(gòu)建的應(yīng)用實例,不僅對研究現(xiàn)狀進行了系統(tǒng)梳理,而且穿插著對聽覺研究史上標志性人物和事例的介紹。對聽覺問題的闡釋直擊本質(zhì),對相關(guān)數(shù)學(xué)表述及推導(dǎo)過程的講解尤為清晰明了,無須復(fù)雜的專業(yè)知識也能逐步理解。此外,所有聽覺處理算法均配有可免費下載的源代碼,便于讀者實踐。

作者簡介

  理查德·F.里昂(Richard F.Lyon),谷歌公司首席科學(xué)家,IEEE Fellow,ACM Fellow。他目前主要負責(zé)谷歌機器聽覺方向的研發(fā)工作,其團隊開發(fā)了用于谷歌街景的相機系統(tǒng)。他的研究興趣包括用于聲音分析及可視化的耳蝸模型和聽覺相關(guān)譜圖,以及這些模型的模擬電路及VLSI數(shù)字實現(xiàn)。在加入谷歌之前,他曾在施樂公司、斯倫貝謝公司和蘋果公司從事相關(guān)研發(fā)工作。此外,他還擁有包括光電鼠標在內(nèi)的58項美國發(fā)明專利授權(quán)。朱維彬,博士,北京交通大學(xué)信息科學(xué)研究所副教授,主要從事言語信息處理理論及應(yīng)用研究,涉及語義的言語表現(xiàn)及計算、言語情感分析及建模。曾在IBM中國研究中心任研究員,從事語音聲學(xué)模型、韻律建模和言語數(shù)據(jù)庫的研究。高瑩瑩,博士,畢業(yè)于北京交通大學(xué)信息科學(xué)研究所,研究方向為言語情感生成建模?,F(xiàn)就職于中國移動研究院人工智能與智慧運營中心,主要從事語音識別、端到端一體化建模的研究。

圖書目錄

譯者序
序言
前言
關(guān)于作者
第一部分 聲音分析與表征概述
第1章 引言
1.1 DavidMarr論視覺與聽覺
1.2 自上而下與自下而上分析
1.3 神經(jīng)模擬方法
1.4 聽覺圖像
1.5 耳朵是頻率分析器嗎
1.6 第三音
1.7 聲音理解與意義提取
1.8 機器視覺與機器學(xué)習(xí)技術(shù)的利用
1.9 本書的內(nèi)容安排
第2章 聽覺理論
2.1 一種“新”的聽覺理論
2.2 更新的聽覺理論
2.3 主動與非線性聽覺理論
2.4 聽覺三元理論
2.5 聽覺圖像理論
第3章 對數(shù)及冪律聽覺
3.1 對數(shù)與冪律
3.2 對數(shù)頻率
3.3 對數(shù)功率
3.4 Bode圖
3.5 感知映射
3.6 恒Q值分析
3.7 對數(shù)應(yīng)用注意事項
第4章 人類聽覺概述
4.1 人機對比
4.2 聽覺生理學(xué)
4.3 聽覺中的關(guān)鍵問題
4.4 響度
4.5 臨界頻帶、掩蔽與抑制
4.6 音高感知
4.7 音色
4.8 協(xié)和與不協(xié)和
4.9 語音感知
4.10 雙耳聽覺
4.11 聽覺流
4.12 非線性
4.13 后續(xù)建議
第5章 聲學(xué)方法與聽覺修正
5.1 聲音、語音與音樂建模
5.2 短時譜分析
5.3 譜的平滑與變換
5.4 源一濾波器模型與同態(tài)信號處理
5.5 擺脫對數(shù)
5.6 聽覺頻率尺度
5.7 mel頻率倒譜
5.8 線性預(yù)測編碼
5.9 PLP與RASTA
5.10 自動語音識別中的聽覺技術(shù)
5.11 必要的改進
第二部分 聽覺的系統(tǒng)理論
第6章 線性系統(tǒng)引言
6.1 平滑:恰當(dāng)?shù)钠瘘c
6.2 線性時不變系統(tǒng)
6.3 濾波器與頻率
6.4 微分方程與齊次解
6.5 沖激響應(yīng)
6.6 因果性與穩(wěn)定性
6.7 卷積
6.8 本征函數(shù)與傳遞函數(shù)
6.9 頻率響應(yīng)
6.10 變換與運算方法
6.11 有理函數(shù)及其零極點
6.12 傳遞函數(shù)增益與相位的圖解計算
6.13 卷積定理
6.14 級聯(lián)、并聯(lián)與反饋結(jié)構(gòu)中濾波器的互聯(lián)
6.15 總結(jié)及后續(xù)安排
第7章 離散時間與數(shù)字系統(tǒng)
7.1 計算機模擬系統(tǒng)
7.2 離散時間線性移不變系統(tǒng)
7.3 沖激響應(yīng)與卷積
7.4 離散時間系統(tǒng)中的頻率
7.5 Z變換及其逆變換
7.6 單位超前算子與單位延遲算子
7.7 濾波器與傳遞函數(shù)
7.8 采樣與混疊
7.9 自連續(xù)時間系統(tǒng)的映射
7.10 濾波器設(shè)計
7.11 數(shù)字濾波器
7.12 多輸入輸出
7.13 傅里葉分析與頻譜圖
7.14 觀點及拓展閱讀
第8章 諧振器
……
第三部分 聽覺外周
第四部分 聽神經(jīng)系統(tǒng)
第五部分 機器學(xué)習(xí)及應(yīng)用
中英文術(shù)語對照表
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號