注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計自然語言理解與行業(yè)知識圖譜:概念、方法與工程落地

自然語言理解與行業(yè)知識圖譜:概念、方法與工程落地

自然語言理解與行業(yè)知識圖譜:概念、方法與工程落地

定 價:¥119.00

作 者: 王楠,趙宏宇,蔡月 著
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111698302 出版時間: 2022-02-01 包裝:
開本: 頁數(shù): 字數(shù):  

內(nèi)容簡介

  本部分首先闡述自然語言理解的發(fā)展脈絡(luò)和理解邏輯,主要圍繞語言符號、處理體系、語義理解等進行探討,引出自然語言理解的自動分析原理和方法,包括自然語言特征、統(tǒng)計學(xué)習、機器學(xué)習、深度學(xué)習、知識圖譜等。第1章概述自然語言發(fā)展脈絡(luò),描述了語言理解的研究現(xiàn)狀、商業(yè)形勢、認知突破口和未來預(yù)測。第2章梳理語言理解的演變流程,介紹我們面臨的各類自然語言理解任務(wù),最后給出語言理解的研究體系框架,引出自然語言理解的基礎(chǔ)——自然語言處理。第3章重點介紹自然語言處理相關(guān)特征工程和文本任務(wù)對應(yīng)的各類算法模型、深度學(xué)習的前沿進展。語言處理需要考慮特征構(gòu)造(字、詞、句、章級別)和特征表示,以利于后續(xù)自動處理。在特征表示方面,從早的符號表示到現(xiàn)在的張量表示,形成統(tǒng)計學(xué)習的基礎(chǔ)。接下來結(jié)合統(tǒng)計學(xué)習框架,論述語言學(xué)習原理和語言模型,結(jié)合概率圖模型和其他機器學(xué)習算法,闡述這些常規(guī)算法在自然語言處理任務(wù)中的應(yīng)用和效果。然后進一步討論深度學(xué)習的各類算法,對語言學(xué)習中的神經(jīng)網(wǎng)絡(luò)算法和新成果進行分析。最后探討現(xiàn)有處理方法的發(fā)展邊界,提出引入外源知識(知識圖譜)來提高認知能力的必要性。第4章系統(tǒng)介紹知識圖譜,包括知識圖譜工程和知識圖譜智能。然后梳理國內(nèi)外常見的通用知識圖譜,并進一步總結(jié)熱門行業(yè)的知識圖譜發(fā)展現(xiàn)狀。最后結(jié)合語言知識和知識圖譜的搭建流程,引入語義特征,通過行業(yè)文本實例操作,幫助讀者了解語義理解的本質(zhì)。行業(yè)知識圖譜部分包含第5~8章。本部分在上述基本自然語言處理方法講解的基礎(chǔ)上,繼續(xù)闡述行業(yè)知識圖譜搭建和行業(yè)應(yīng)用的方法。目前從事自然語言理解的公司都將精力放在通用文本理解上,這些文本往往口語化嚴重、特征雜亂、信息量不足,導(dǎo)致算法處理形成的最終產(chǎn)品的用戶體驗不佳??紤]到行業(yè)文本往往有一定規(guī)范,相對容易取得突破口,也有利于推動行業(yè)發(fā)展,所以我們選擇從行業(yè)文本出發(fā),以專利文本實操作為樣板。第5章介紹行業(yè)知識工程實踐,以專利行業(yè)為例,詳細地描述了一個行業(yè)知識工程建設(shè)的過程。首先基于自然語言處理和知識圖譜搭建方法,建設(shè)行業(yè)知識庫,包括術(shù)語庫、產(chǎn)品庫、技術(shù)庫、標準庫、規(guī)則庫等,進而開發(fā)行業(yè)主題分析模型、行業(yè)文本分類算法、相似度計算方法、價值評估方法和機器翻譯方法。第6章介紹知識圖譜模塊的搭建,包括關(guān)鍵詞助手、語義搜索、分級管理、高級分析、推薦和問答等。結(jié)合實際應(yīng)用,探討知識圖譜在提高智能性方面的能力和效果。第7章在前面知識工程和知識圖譜智能基礎(chǔ)上搭建智能應(yīng)用平臺,介紹了平臺的各類功能組件,描述了自下而上的軟件服務(wù)封裝邏輯,進一步向上封裝為行業(yè)文本分析功能組件,包括檢索、分析、挖掘、管理、預(yù)警、運營等。讀者可以將這套思路在各行業(yè)進行實踐驗證,將上述組件和權(quán)限、安全板塊集成為應(yīng)用平臺,搭建常態(tài)化文本分析運營平臺,完成平臺級別或各細分模塊的商業(yè)產(chǎn)品落地。第8章依托智能應(yīng)用平臺,結(jié)合實踐案例給出團隊的應(yīng)用經(jīng)驗,即通過四個行業(yè)案例來驗證平臺的認知能力?!蹲匀徽Z言理解與行業(yè)知識圖譜:概念、方法與工程落地》以自然語言理解和行業(yè)知識圖譜應(yīng)用落地為目標,闡述了一個從0到1的行業(yè)文本理解案例?!蹲匀徽Z言理解與行業(yè)知識圖譜:概念、方法與工程落地》為互聯(lián)網(wǎng)企業(yè)的智能平臺構(gòu)建提供了很好的案例參考,也為行業(yè)信息化從業(yè)者提供了從入門到進階的技術(shù)指導(dǎo),適合作為自然語言處理、知識圖譜、計算機、人工智能等領(lǐng)域從業(yè)者的學(xué)習指導(dǎo)書,也非常適合對自然語言處理、知識圖譜感興趣的學(xué)生和創(chuàng)業(yè)團隊閱讀。

作者簡介

  王楠,北京大學(xué)博士,“創(chuàng)青春-中關(guān)村U30”2020年度優(yōu)勝者,先后任教于中國科學(xué)院、北京信息科技大學(xué)計算機學(xué)院。研究方向包括人工智能算法、知識圖譜、自然語言處理與地球電磁學(xué)等。主持或參與國家科技重大專項、高分專項、軍口預(yù)研、衛(wèi)星系統(tǒng)、企業(yè)大數(shù)據(jù)系統(tǒng)等科研項目,累計獲得研發(fā)經(jīng)費超過千萬元人民幣。負責企業(yè)級“專利大數(shù)據(jù)智能分析系統(tǒng)”的研發(fā),領(lǐng)導(dǎo)技術(shù)團隊完成軟件平臺搭建、商用和優(yōu)化。以作者身份發(fā)表行業(yè)內(nèi)高水平論文十余篇,獲得多項發(fā)明和實用新型專利,提交專利申請十余項。趙宏宇,現(xiàn)就職于騰訊看點搜索團隊,擔任算法研究員。有多年NLP、搜索系統(tǒng)、推薦系統(tǒng)的工作經(jīng)驗,涉及專利、招聘和網(wǎng)頁搜索等場景。精通PyTorch、TensorFlow等主流深度學(xué)習框架,擅長運用NLP前沿技術(shù)解決工業(yè)項目難題。在意圖識別、內(nèi)容推薦、相關(guān)性排序等領(lǐng)域有多年實戰(zhàn)經(jīng)驗。曾參與千萬級用戶求職領(lǐng)域的推薦工作,作為算法主要負責人,主導(dǎo)全新算法落地迭代、線上算法優(yōu)化以及上億DAU網(wǎng)頁搜索優(yōu)化迭代。曾與人合著《智能搜索與推薦系統(tǒng):原理、算法與應(yīng)用》一書。蔡月,清華-深圳灣實驗室聯(lián)合培養(yǎng)博士后,于2017年獲得北京大學(xué)生物醫(yī)學(xué)工程博士學(xué)位。曾擔任東軟醫(yī)療上海磁共振研發(fā)中心高級算法研究員。研究方向為數(shù)據(jù)科學(xué)、磁共振圖像算法、深度學(xué)習等,擅長腦科學(xué)領(lǐng)域數(shù)據(jù)分析、磁共振圖像加速、去噪等算法研究。曾在腦科學(xué)領(lǐng)域SCI期刊Neuroscience、Neurotoxicity Research上發(fā)表多篇文章,獲得多項發(fā)明專利。

圖書目錄



本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號