注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)操作系統(tǒng)大型語(yǔ)言模型實(shí)戰(zhàn)指南:應(yīng)用實(shí)踐與場(chǎng)景落地

大型語(yǔ)言模型實(shí)戰(zhàn)指南:應(yīng)用實(shí)踐與場(chǎng)景落地

大型語(yǔ)言模型實(shí)戰(zhàn)指南:應(yīng)用實(shí)踐與場(chǎng)景落地

定 價(jià):¥99.00

作 者: 劉聰 沈盛宇 李特麗 杜振東
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111758457 出版時(shí)間: 2024-08-01 包裝: 平裝-膠訂
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  內(nèi)容簡(jiǎn)介 這是一本系統(tǒng)梳理并深入解析大模型的基礎(chǔ)理論、算法實(shí)現(xiàn)、數(shù)據(jù)構(gòu)造流程、模型微調(diào)方法、偏好對(duì)齊方法的著作,也是一本能手把手教你構(gòu)建角色扮演、信息抽取、知識(shí)問(wèn)答、AI Agent等各種強(qiáng)大的應(yīng)用程序的著作。本書(shū)得到了零一萬(wàn)物、面壁智能、通義千問(wèn)、百姓AI、瀾舟科技等國(guó)內(nèi)主流大模型團(tuán)隊(duì)的負(fù)責(zé)人的高度評(píng)價(jià)和鼎力推薦。具體地,通過(guò)本書(shū)你能了解或掌握以下知識(shí):(1)大型語(yǔ)言模型的基礎(chǔ)理論,包括常見(jiàn)的模型架構(gòu)、領(lǐng)域大型語(yǔ)言模型以及如何評(píng)估大模型的性能。(2)大模型微調(diào)的關(guān)鍵步驟:從數(shù)據(jù)的收集、清洗到篩選,直至微調(diào)訓(xùn)練的技術(shù)細(xì)節(jié)。(3)大模型人類偏好對(duì)齊方法,從基于人工反饋的強(qiáng)化學(xué)習(xí)框架到當(dāng)前主流的對(duì)齊方法。(4)通過(guò)GPTs快速搭建個(gè)性化的專屬ChatGPT應(yīng)用。(5)通過(guò)開(kāi)源模型在多種場(chǎng)景下搭建大模型應(yīng)用,包括:表格查詢、角色扮演、信息抽取、知識(shí)問(wèn)答、AI Agent等。(6)掌握大模型Agent方法以及Agent常用框架。(7)基于LangChain框架構(gòu)建一個(gè)AutoGPT應(yīng)用。本書(shū)集大模型理論、實(shí)踐和場(chǎng)景落地于一體,提供大量經(jīng)詳細(xì)注釋的代碼,方便讀者理解和實(shí)操??傊还芾锸窍肷钊胙芯看竽P捅旧?,還是進(jìn)行大模型相關(guān)應(yīng)用搭建,本書(shū)都應(yīng)該能給你頗具價(jià)值的技術(shù)啟發(fā)與思考,讓你在大模型的路上快速前行,少走彎路。

作者簡(jiǎn)介

  劉聰資深NLP技術(shù)專家和AI技術(shù)專家,南京云問(wèn)科技首席算法架構(gòu)師,MLNLP(機(jī)器學(xué)習(xí)算法與自然語(yǔ)言處理)社區(qū)學(xué)術(shù)委員。主攻文本向量表征、問(wèn)答系統(tǒng)、AIGC等技術(shù)方向,是大模型領(lǐng)域的先驅(qū)者和布道者。開(kāi)源了首個(gè)中文Unilm預(yù)訓(xùn)練模型、中文GPT2、夸夸閑聊機(jī)器人(ChatBot)、大模型微調(diào)等項(xiàng)目。作為主要負(fù)責(zé)人,在多項(xiàng)自然語(yǔ)言處理比賽中獲得前三名,在中文核心期刊和SCI發(fā)表多篇論文,有多項(xiàng)發(fā)明專利。知乎ID“劉聰NLP”,擁有公眾號(hào)“NLP工作站”,撰寫(xiě)書(shū)籍《ChatGPT原理與實(shí)戰(zhàn)》。沈盛宇資深算法工程師,南京云問(wèn)網(wǎng)絡(luò)技術(shù)有限公司算法組負(fù)責(zé)人。擅長(zhǎng)結(jié)合用戶業(yè)務(wù)場(chǎng)景,針對(duì)性設(shè)計(jì)知識(shí)圖譜、問(wèn)答、檢索、多模態(tài)、AIGC等的相關(guān)算法和落地方案。在結(jié)合客戶現(xiàn)有產(chǎn)品體系,推動(dòng)數(shù)據(jù)中臺(tái)和算法平臺(tái)結(jié)合,從而提升服務(wù)質(zhì)量方面,有豐富實(shí)戰(zhàn)經(jīng)驗(yàn)。曾獲得多項(xiàng)國(guó)家專利,參與制定和撰寫(xiě)《IDP術(shù)語(yǔ)標(biāo)準(zhǔn)》《人工智能-智能助理能力等級(jí)評(píng)估標(biāo)準(zhǔn)》《人工智能標(biāo)準(zhǔn)化與開(kāi)源研究報(bào)告》《ChatGPT原理與實(shí)戰(zhàn)》等多項(xiàng)國(guó)家級(jí)人工智能標(biāo)準(zhǔn)和書(shū)籍。李特麗資深大模型應(yīng)用專家,LangChain中文社區(qū)聯(lián)合創(chuàng)始人,開(kāi)發(fā)Langchain等多個(gè)大模型開(kāi)發(fā)框架的中文網(wǎng),幫助中國(guó)開(kāi)發(fā)者快速學(xué)習(xí)AI開(kāi)發(fā)框架,撰寫(xiě)書(shū)籍《LangChain入門(mén)指南》。杜振東資深NLP技術(shù)專家和AI技術(shù)專家,南京云問(wèn)科技NLP研究院院長(zhǎng),國(guó)家人工智能標(biāo)準(zhǔn)委專家、AIIA 人工智能技術(shù)專家、CCF智能機(jī)器人專業(yè)組首批委員。擁有10年機(jī)器學(xué)習(xí)與文本挖掘經(jīng)驗(yàn),8年中文自然語(yǔ)言處理實(shí)戰(zhàn)經(jīng)驗(yàn),參與制定6項(xiàng)國(guó)家人工智能總體組標(biāo)準(zhǔn),編寫(xiě)書(shū)籍《會(huì)話式AI》《人工智能實(shí)踐錄》《ChatGPT原理與實(shí)戰(zhàn)》等。

圖書(shū)目錄

CONTENTS
目  錄
前言
 
第1章 大型語(yǔ)言模型基礎(chǔ) 1
1.1 Transformer基礎(chǔ) 1
1.2 常用的大型語(yǔ)言模型 4
1.2.1 GPT系列模型 4
1.2.2 OPT模型 11
1.2.3 Bloom模型 12
1.2.4 GLM系列模型 12
1.2.5 LLaMA系列模型 14
1.2.6 Baichuan系列模型 16
1.2.7 Qwen系列模型 18
1.2.8 Skywork模型 19
1.3 領(lǐng)域大型語(yǔ)言模型 21
1.3.1 法律大型語(yǔ)言模型 21
1.3.2 醫(yī)療大型語(yǔ)言模型 24
1.3.3 金融大型語(yǔ)言模型 27
1.3.4 教育大型語(yǔ)言模型 29
1.4 大型語(yǔ)言模型評(píng)估 30
1.4.1 大型語(yǔ)言模型的評(píng)估內(nèi)容 30
1.4.2 大型語(yǔ)言模型的評(píng)估方法 32
1.4.3 大型語(yǔ)言模型評(píng)估榜單 33
1.5 本章小結(jié) 37
 
第2章 大型語(yǔ)言模型的常用微調(diào)方法 38
2.1 數(shù)據(jù)構(gòu)造與清洗 38
2.1.1 數(shù)據(jù)構(gòu)造方法 39
2.1.2 數(shù)據(jù)清洗方法 43
2.2 分詞器構(gòu)造 44
2.2.1 分詞器概述 44
2.2.2 BPE分詞器 45
2.2.3 WordPiece分詞器 52
2.2.4 Unigram分詞器 56
2.2.5 SentencePiece分詞器 58
2.2.6 詞表融合 62
2.3 大型語(yǔ)言模型的微調(diào)方法 63
2.3.1 前綴調(diào)優(yōu) 63
2.3.2 提示調(diào)優(yōu) 64
2.3.3 P-Tuning v2 65
2.3.4 LoRA 65
2.3.5 DyLoRA 66
2.3.6 AdaLoRA 67
2.3.7 QLoRA 67
2.3.8 QA-LoRA 68
2.3.9 LongLoRA 69
2.3.10 VeRA 69
2.3.11 S-LoRA 70
2.4 基于PEFT的LLaMA模型微調(diào)實(shí)戰(zhàn) 71
2.4.1 項(xiàng)目介紹 71
2.4.2 數(shù)據(jù)預(yù)處理 71
2.4.3 模型微調(diào) 72
2.4.4 模型預(yù)測(cè) 77
2.5 本章小結(jié) 78
 
第3章 大型語(yǔ)言模型的人類偏好對(duì)齊 79
3.1 基于人類反饋的強(qiáng)化學(xué)習(xí)框架 79
3.2 前沿偏好對(duì)齊方法 84
3.2.1 RRHF 84
3.2.2 RLAIF 85
3.2.3 DPO 87
3.2.4 APO 89
3.3 基于DPO的偏好對(duì)齊實(shí)戰(zhàn) 90
3.3.1 數(shù)據(jù)集介紹 90
3.3.2 TRL框架介紹 92
3.3.3 訓(xùn)練代碼解析 93
3.4 本章小結(jié) 96
 
第4章 創(chuàng)建個(gè)人專屬的ChatGPT—GPTs 97
4.1 GPTs初體驗(yàn) 97
4.2 GPTs的初階使用 105
4.2.1 知識(shí)庫(kù)的使用 105
4.2.2 內(nèi)置插件的使用 108
4.2.3 知識(shí)庫(kù)與內(nèi)置插件的結(jié)合使用 111
4.3 GPTs的高階使用 113
4.4 本章小結(jié) 122
 
第5章 大型語(yǔ)言模型SQL任務(wù)實(shí)戰(zhàn) 123
5.1 公開(kāi)數(shù)據(jù)集 123
5.1.1 英文公開(kāi)數(shù)據(jù)集 123
5.1.2 中文公開(kāi)數(shù)據(jù)集 128
5.2 主流方法 132
5.2.1 基于規(guī)則的方法 133
5.2.2 基于深度學(xué)習(xí)的方法 133
5.2.3 基于預(yù)訓(xùn)練語(yǔ)言模型的方法 136
5.2.4 基于大型語(yǔ)言模型的方法 136
5.3 Text2SQL任務(wù)實(shí)戰(zhàn) 141
5.3.1 項(xiàng)目介紹 141
5.3.2 數(shù)據(jù)預(yù)處理 142
5.3.3 模型微調(diào) 147
5.3.4 模型預(yù)測(cè) 149
5.4 本章小結(jié) 150
 
第6章 大型語(yǔ)言模型的角色扮演應(yīng)用 151
6.1 角色扮演 151
6.1.1 大型語(yǔ)言模型如何進(jìn)行角色扮演 153
6.1.2 角色扮演數(shù)據(jù)的構(gòu)造方法 155
6.1.3 大型語(yǔ)言模型角色扮演的能力評(píng)估 155
6.2 角色扮演實(shí)戰(zhàn)測(cè)試 156
6.3 基于Baichuan的角色扮演模型微調(diào) 159
6.3.1 項(xiàng)目介紹 159
6.3.2 數(shù)據(jù)預(yù)處理 160
6.3.3 模型微調(diào) 164
6.3.4 模型預(yù)測(cè) 171
6.4 本章小結(jié) 175
 
第7章 大型語(yǔ)言模型的對(duì)話要素抽取應(yīng)用 176
7.1 對(duì)話要素抽取 176
7.2 對(duì)話要素抽取實(shí)戰(zhàn)測(cè)試 177
7.2.1 基于GPT-3.5 API進(jìn)行對(duì)話要素抽取 178
7.2.2 基于Qwen-1.8B模型進(jìn)行對(duì)話要素抽取 180
7.3 基于Qwen的對(duì)話要素抽取模型微調(diào) 183
7.3.1 項(xiàng)目介紹 183
7.3.2 數(shù)據(jù)預(yù)處理 183
7.3.3 模型微調(diào) 190
7.3.4 模型預(yù)測(cè) 198
7.4 本章小結(jié) 202
 
第8章 Agent應(yīng)用開(kāi)發(fā) 203
8.1 Agent概述 203
8.2 Agent的主要模塊 205
8.3 Agent的行為決策機(jī)制 207
8.4 主流Agent 框架 211
8.4.1 LangChain框架 211
8.4.2 LlamaIndex框架 214
8.4.3 AutoGPT框架 215
8.4.4 AutoGen 框架 216
8.4.5 SuperAGI框架 219
8.5 本章小結(jié) 221
 
第9章 基于知識(shí)庫(kù)的大型語(yǔ)言模型問(wèn)答應(yīng)用 222
9.1 基于知識(shí)庫(kù)問(wèn)答 222
9.2 向量數(shù)據(jù)庫(kù) 224
9.2.1 文本的向量表征 225
9.2.2 向量的距離度量方法 228
9.2.3 常用的向量數(shù)據(jù)庫(kù) 229
9.3 基于知識(shí)庫(kù)的大型語(yǔ)言模型問(wèn)答實(shí)戰(zhàn) 231
9.3.1 BGE微調(diào) 231
9.3.2 基于ChatGLM3知識(shí)庫(kù)答案生成任務(wù)的微調(diào) 238
9.3.3 基于Streamlit 的知識(shí)庫(kù)答案應(yīng)用搭建 245
9.4 本章小結(jié) 249
 
第10 章 使用LangChain 構(gòu)建一個(gè)AutoGPT 250
10.1 AutoGPT 概述 250
10.2 LangChain 概述 253
10.3 使用LangChain 構(gòu)建AutoGPT 254
10.3.1 構(gòu)建 254
10.3.2 規(guī)劃和任務(wù)分解 255
10.3.3 輸出解析 258
10.3.4 程序的核心AutoGPT類 261
10.3.5 工具能力配置 266
10.3.6 為Agent 配置記憶 269
10.4 運(yùn)行AutoGPT 274
10.5 本章小結(jié) 277

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)