注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)人工智能視覺(jué)語(yǔ)言交互中的視覺(jué)推理研究

視覺(jué)語(yǔ)言交互中的視覺(jué)推理研究

視覺(jué)語(yǔ)言交互中的視覺(jué)推理研究

定 價(jià):¥49.00

作 者: 牛玉磊
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111723035 出版時(shí)間: 2023-03-01 包裝: 平裝-膠訂
開(kāi)本: 32開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《視覺(jué)語(yǔ)言交互中的視覺(jué)推理研究》的作者牛玉磊博士于2020年在中國(guó)人民大學(xué)取得博士學(xué)會(huì),后前往美國(guó)哥倫比亞大學(xué)開(kāi)展博士后研究工作。本書(shū)從知識(shí)建模和知識(shí)推斷兩方面入手,深入研究了視覺(jué)語(yǔ)言交互任務(wù)中的視覺(jué)推理問(wèn)題?!兑曈X(jué)語(yǔ)言交互中的視覺(jué)推理研究》共五章:第1章主要介紹了計(jì)算機(jī)視覺(jué)與自然語(yǔ)言處理交叉領(lǐng)域中交互類(lèi)問(wèn)題的研究背景,并分別從單輪交互、多輪交互、知識(shí)偏差三個(gè)角度選取了指稱(chēng)語(yǔ)理解、視覺(jué)對(duì)話、視覺(jué)問(wèn)答三個(gè)經(jīng)典任務(wù)展開(kāi)討論。第2章主要介紹了單輪交互情形的代表性視覺(jué)推理任務(wù),即指稱(chēng)語(yǔ)理解問(wèn)題,提出了變分背景框架,根據(jù)視覺(jué)圖像和指稱(chēng)語(yǔ)文本的聯(lián)系及視覺(jué)物體之間的關(guān)系提取語(yǔ)義背景信息,并根據(jù)背景信息對(duì)指稱(chēng)語(yǔ)進(jìn)行定位。第3章介紹了多輪交互情形的代表性視覺(jué)推理任務(wù),即視覺(jué)對(duì)話問(wèn)題,提出了遞歸注意力機(jī)制,通過(guò)視覺(jué)指代消解的思想對(duì)圖像、對(duì)話和問(wèn)題之間的聯(lián)系進(jìn)行建模,優(yōu)化視覺(jué)表示。第4章介紹了知識(shí)偏差情形的代表性視覺(jué)推理任務(wù),即視覺(jué)問(wèn)答問(wèn)題,基于因果推理提出了反事實(shí)視覺(jué)問(wèn)答框架,在訓(xùn)練環(huán)境和測(cè)試環(huán)境的答案分布不一致情況下,通過(guò)因果效應(yīng)的視角提取并去除語(yǔ)言偏差。第5章對(duì)本書(shū)進(jìn)行了總結(jié),并對(duì)未來(lái)研究方向進(jìn)行了展望。

作者簡(jiǎn)介

  牛玉磊,美國(guó)哥倫比亞大學(xué)博士后,2015年和2020年于中國(guó)人民大學(xué)分別獲得學(xué)士與博士學(xué)位。研究方向包括計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)、因果推理、多模態(tài)學(xué)習(xí)等,在國(guó)際著名學(xué)術(shù)會(huì)議和期刊上發(fā)表論文20余篇。擔(dān)任BMVC 2022領(lǐng)域主席,AAAI 2023、IJCAI 2021高級(jí)程序委員會(huì)委員等學(xué)術(shù)職務(wù)。獲2021年度CCF優(yōu)秀博士學(xué)位論文獎(jiǎng)、CVPR 2019視覺(jué)對(duì)話挑戰(zhàn)賽冠軍,被評(píng)為NeurIPS 2022、ICLR 2021、ICCV 2021的杰出審稿人。

圖書(shū)目錄

第1章 引言
1.1 研究背景 1
1.2 研究現(xiàn)狀 5
1.2.1 指稱(chēng)語(yǔ)理解 6
1.2.2 視覺(jué)對(duì)話 8
1.2.3 視覺(jué)問(wèn)答 11
1.3 研究?jī)?nèi)容與貢獻(xiàn) 14
1.4 組織結(jié)構(gòu) 17
第2章 單輪交互情形下的指稱(chēng)語(yǔ)理解
2.1 研究概述 20
2.2 相關(guān)工作 23
2.3 變分背景框架 26
2.3.1 問(wèn)題表述 26
2.3.2 指稱(chēng)語(yǔ)理解 29
2.3.3 指稱(chēng)語(yǔ)生成 31
2.3.4 模型實(shí)現(xiàn) 32
2.4 實(shí)驗(yàn)結(jié)果 40
2.4.1 實(shí)驗(yàn)設(shè)置 40
2.4.2 指稱(chēng)語(yǔ)理解實(shí)驗(yàn)結(jié)果 44
2.4.3 指稱(chēng)語(yǔ)生成實(shí)驗(yàn)結(jié)果 55
2.5 小結(jié) 57
第3章 多輪交互情形下的視覺(jué)對(duì)話
3.1 研究概述 60
3.2 相關(guān)工作 64
3.3 預(yù)備知識(shí) 66
3.4 遞歸視覺(jué)注意力模型 66
3.4.1 判別模塊 68
3.4.2 匹配模塊 69
3.4.3 注意力模塊 72
3.5 其他模塊 73
3.5.1 語(yǔ)言特征表示 73
3.5.2 視覺(jué)特征表示 75
3.5.3 特征優(yōu)化與融合 76
3.5.4 非線性映射 78
3.5.5 Gumbel離散采樣 79
3.6 實(shí)驗(yàn)結(jié)果 80
3.6.1 實(shí)驗(yàn)設(shè)置 80
3.6.2 實(shí)現(xiàn)細(xì)節(jié) 82
3.6.3 對(duì)比方法 82
3.6.4 實(shí)驗(yàn)結(jié)果分析 85
3.7 小結(jié) 93
第4章 知識(shí)偏差情形下的視覺(jué)問(wèn)答
4.1 研究概述 96
4.2 相關(guān)工作 101
4.3 預(yù)備知識(shí) 104
4.3.1 因果圖 105
4.3.2 反事實(shí)表示 105
4.3.3 因果效應(yīng) 106
4.4 基于簡(jiǎn)化因果圖的反事實(shí)視覺(jué)問(wèn)答 107
4.4.1 反事實(shí)視覺(jué)問(wèn)答框架 108
4.4.2 技術(shù)實(shí)現(xiàn) 110
4.5 基于完全因果圖的反事實(shí)視覺(jué)問(wèn)答 115
4.5.1 反事實(shí)視覺(jué)問(wèn)答框架 115
4.5.2 技術(shù)實(shí)現(xiàn) 116
4.6 實(shí)現(xiàn)細(xì)節(jié) 119
4.7 實(shí)驗(yàn)結(jié)果 120
4.7.1 實(shí)驗(yàn)設(shè)置 120
4.7.2 簡(jiǎn)化因果圖實(shí)驗(yàn)結(jié)果 122
4.7.3 完全因果圖實(shí)驗(yàn)結(jié)果 134
4.8 小結(jié) 137
第5章 總結(jié)與展望
5.1 創(chuàng)新總結(jié) 139
5.2 未來(lái)工作展望 141
5.2.1 視覺(jué)推理任務(wù) 142
5.2.2 知識(shí)建模 142
5.2.3 知識(shí)偏差 143

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)