定 價:¥35.00
作 者: | 梁社會 |
出版社: | 北京大學出版社 |
叢編項: | |
標 簽: | 暫缺 |
ISBN: | 9787301320983 | 出版時間: | 2021-05-01 | 包裝: | 平裝-膠訂 |
開本: | 16開 | 頁數: | 字數: |
目 錄
引 言 1
一、《孟子》及其注疏信息處理研究現狀 1
(一)傳統(tǒng)的《孟子》及其注疏的研究 2
(二)句子對齊技術研究 3
(三)自動分詞研究 4
(四)詞性標注研究 6
(五)詞義消歧研究 6
(六)風格計算研究 8
(七)修辭格的識別 9
(八)余論 9
二、研究思路和研究內容 10
(一)研究思路 10
(二)研究內容 11
三、本書的結構安排 11
章 注疏對齊 13
一、注疏結構和注疏文獻的作用 14
(一)注疏結構 14
(二)注疏文獻的作用 17
二、注疏文獻的平行對齊 18
(一)原文與引文句子對齊 19
(二)原文與引文注釋對齊 33
三、本章小結 41
第二章 自動分詞 42
一、先秦漢語分詞規(guī)范 43
二、基于規(guī)則的自動分詞方法 49
(一)匹配法簡介 49
(二)詞表介紹 50
(三)實驗結果 51
三、基于統(tǒng)計模型的自動分詞方法 55
(一)條件隨機場模型 55
(二)CRFs分詞原理 55
(三)基于CRFs的分詞實驗 56
四、利用注疏文獻的自動分詞方法 60
(一)利用注疏文獻自動分詞方法概述 60
(二)利用注疏文獻自動分詞實驗 61
五、本章小結 65
第三章 詞性標注 66
一、詞性標記集的構建 67
(一)名詞作狀語 67
(二)其他詞類活用作動詞 67
(三)使動用法 68
(四)意動用法 68
(五)為動用法 68
二、基于條件隨機場模型的詞性標注 69
(一)CRFs自動詞性標注原理 70
(二)基于CRFs的詞性標注實驗 71
(三)標注錯誤分析 73
三、利用注疏信息自動校正詞性 73
(一)注疏文獻中的詞性提示信息 73
(二)利用去聲信息的詞性自動校正方法 75
(三)實驗和分析 78
四、本章小結 79
第四章 詞義消歧 80
一、詞義消歧的概念和難點 81
(一)詞義消歧的概念 81
(二)詞義消歧的難點 81
二、詞義消歧樹算法消歧 82
(一)義項的劃分 82
(二)上下文的有效范圍 83
(三)消歧方法的設計 85
三、CRFs模型詞義消歧 89
(一)特征的選擇提取 89
(二)特征模板的構造 91
四、實驗結果與分析 92
(一)實驗的語料 92
(二)實驗環(huán)境與測評指標 92
(三)兩種消歧算法比較 93
五、本章小結 95
第五章 風格計算 97
一、文本特征及語言風格分析 100
(一)基于字的文本特征及語言風格統(tǒng)計 100
(二)基于詞的文本特征及語言風格統(tǒng)計 108
(三)基于句子的文本特征及語言風格統(tǒng)計 116
二、排比句的自動識別 118
(一)排比句自動識別的算法設計 118
(二)實驗及結果分析 127
三、本章小結 134
結 語 136
一、本研究的主要工作 136
二、進一步的研究計劃 138
附 錄 141
附錄A:注疏文獻中抽取出的去聲字表 141
附錄B:注疏文獻中抽取出的反切字表 149
附錄C:人工標注的《孟子》排比句 157
附錄D:人工標注的《論語》排比句 167
參考文獻 172
后 記 186