注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡人工智能文字識別:原理、方法和實踐

文字識別:原理、方法和實踐

文字識別:原理、方法和實踐

定 價:¥128.00

作 者: 丁曉青,王言偉 等 著
出版社: 清華大學出版社
叢編項:
標 簽: 計算機/網(wǎng)絡 人工智能

ISBN: 9787302454625 出版時間: 2017-04-01 包裝: 平裝
開本: 16 頁數(shù): 610 字數(shù):  

內(nèi)容簡介

  本書基于模式識別和信息熵理論,全面、系統(tǒng)和深入地分析介紹了各種漢字、多文種文字識別的理論和方法,以及解決復雜多變的多文種文字和文檔識別中關鍵問題的有效算法和具體實踐。本書可以作為相關專業(yè)研究生的參考書,也可以供從事模式識別、文字和文檔識別等計算機信息處理研究的科研人員和從事相關產(chǎn)品開發(fā)的工程技術人員閱讀參考。

作者簡介

  作者:丁曉青 王言偉等

圖書目錄

目錄第1章緒論1.1引言1.2文字和漢字1.2.1文字的代碼表示1.2.2漢字的字體字形1.2.3漢字的特點 1.2.4中文信息處理1.3文字識別和漢字識別1.4文字識別研究歷程1.5文字識別分類1.5.1按照不同文種文字和文檔的識別技術分類1.5.2按照獲取圖像方式和識別對象不同分類1.5.3單個字符識別和文檔篇章識別1.6文字識別與筆跡鑒別1.7漢字識別的基本方法——基于視覺感知的漢字識別方法1.8關于本書參考文獻第2章模式識別和模式識別信息熵理論2.1引言: 模式與模式識別2.2基于貝葉斯統(tǒng)計決策的模式識別2.3模式識別統(tǒng)一信息熵理論2.3.1特征和類別及其相關信息熵2.3.2后驗熵:*優(yōu)貝葉斯分類器誤識率的上限2.3.3模式識別的學習與識別信息過程2.3.4互信息:決定模式識別性能的鑒別熵2.4正態(tài)分布條件下的模式識別信息熵系統(tǒng)2.5*大互信息鑒別分析(互信息鑒別子空間模式識別) 2.5.1*大互信息子空間線性鑒別分析方法2.5.2*大互信息線性鑒別分析與線性鑒別分析LDA2.6特征選擇的信息熵準則2.6.1基于錯誤概率的類別可分性準則2.6.2基于有效互信息的類別可分性準則2.7從信息熵分析看提高識別性能的途徑2.8漢字集合和漢字文本的信息熵2.8.1漢字集合的信息熵2.8.2漢字文本的信息熵和漢字的極限熵2.9本章小結參考文獻第3章漢字識別的特征提取3.1引言3.2漢字字符圖像規(guī)一化預處理3.2.1線性規(guī)一化3.2.2非線性規(guī)一化3.2.3基于整體密度均衡的非線性規(guī)一化3.3漢字識別中的特征抽取3.3.1結構特征3.3.2統(tǒng)計特征3.4漢字識別特征提取研究的發(fā)展歷程3.4.1基于圖像變換的印刷漢字識別特征和系統(tǒng) 3.4.2基于形態(tài)學漢字結構分析的兩級印刷漢字識別特征和系統(tǒng)3.4.3漢字筆畫密度微結構全局特征及多字體漢字識別系統(tǒng)3.4.4基于漢字筆畫方向網(wǎng)格特征的魯棒漢字識別系統(tǒng)3.5筆畫方向線素特征3.5.1方向線素特征的形成方法3.5.2網(wǎng)格化方向線素特征3.5.3對原模糊分塊方法的改進——低通采樣方向線素特征3.5.4實驗和結果3.6基于Gabor濾波器的高性能漢字識別方向特征3.6.1Gabor變換理論分析3.6.2適用于漢字識別的Gabor濾波器組設計及實驗驗證3.6.3對Gabor濾波器組輸出的非線性變換3.6.4分塊特征的抽取3.6.5實驗及結果3.7漢字識別梯度方向特征抽取方法3.7.1梯度方向特征3.7.2梯度方向特征的快速算法3.8不同筆畫方向特征的識別性能實驗比較3.9本章小結參考文獻第4章特征的鑒別分析和分布整形4.1引言4.2線性鑒別分析4.2.1優(yōu)化準則4.2.2變換形式和*優(yōu)解4.2.3變換的分解形式4.2.4啟發(fā)式討論4.2.5實驗與結果4.2.6小結 4.3正則化線性鑒別分析4.3.1小樣本帶來的問題4.3.2利用正則化估計協(xié)方差陣4.3.3實驗結果4.4異方差鑒別分析4.4.1基于極大似然估計的異方差線性鑒別分析4.4.2基于Chernoff準則的異方差線性鑒別分析4.4.3基于Mahalanobis準則的異方差線性鑒別分析4.4.4實驗結果4.4.5小結4.5特征統(tǒng)計分布整形變換4.5.1特征分布的整形4.5.2正態(tài)性檢驗4.5.3BoxCox變換4.5.4方向線素及梯度特征的整形4.5.5實驗與結果4.6本章小結參考文獻第5章模式識別分類器設計/統(tǒng)計模式分類方法5.1引言5.2貝葉斯判決理論5.3正態(tài)分布下的貝葉斯分類器5.3.1正態(tài)分類模型5.3.2*小距離分類器MDC5.3.3線性距離分類器LDC 5.3.4二次鑒別函數(shù)分類器QDF5.3.5二次鑒別函數(shù)5.3.6QDF誤差分析5.4改進二次鑒別函數(shù)分類器MQDF5.4.1修正二次鑒別分類MQDF5.4.2QDF修正形式的貝葉斯估計推導5.4.3實驗與結果5.5系統(tǒng)實現(xiàn)與應用5.5.1非限定脫機手寫漢字識別系統(tǒng)5.5.2多字體印刷中、日、韓文識別系統(tǒng)5.6分類器的置信度分析5.6.1分類器的置信度和廣義置信度5.6.2基于距離的分類器的廣義置信度估計5.6.3多層前向神經(jīng)網(wǎng)絡分類器廣義置信度估計5.6.4從廣義置信度求置信度的方法5.6.5使用ACT估計后驗概率5.6.6置信度分析在字符識別中的應用5.6.7小結5.7分類器集成5.7.1集成的3個層次5.7.2基于線性回歸的多分類器集成5.7.3利用線性回歸提高后驗概率估計的準確性5.7.4后驗概率的估計誤差與誤識率的關系5.7.5實驗結果5.7.6小結5.8本章小結參考文獻第6章無約束手寫漢字識別分類器鑒別學習6.1引言6.2基于*小錯誤率的鑒別學習6.2.1*小錯誤率學習6.2.2基于MCE的多模板距離分類器參數(shù)鑒別學習6.2.3基于MCE的MQDF分類器參數(shù)鑒別學習6.2.4基于MCE的正交混合高斯模型的鑒別學習6.3基于啟發(fā)式的鑒別學習方法6.3.1矯正學習6.3.2鏡像學習方法6.3.3樣本重要性加權學習方法6.4本章小結參考文獻第7章聯(lián)機手寫漢字識別7.1引言7.1.1聯(lián)機手寫漢字識別方法回顧7.2描述結構的統(tǒng)計模型——SSM7.2.1基元間關系的描述7.2.2結構統(tǒng)計模型SSM的定義及概率分析7.2.3SSM應用于聯(lián)機手寫漢字識別7.2.4實驗與分析7.2.5小結7.3路徑受控HMM和時空統(tǒng)一模型7.3.1路徑受控HMM(PCHMM)7.3.2PCHMM在聯(lián)機手寫漢字識別中的應用7.3.3聯(lián)機手寫漢字識別的時空統(tǒng)一模型——STUM7.3.4實驗與分析7.3.5小結7.4基于全局模式分析的統(tǒng)計結構特征7.4.1聯(lián)機漢字筆跡的結構分析7.4.2聯(lián)機手寫漢字分類特征的分析與提取7.4.3小結7.5高性能聯(lián)機手寫漢字識別系統(tǒng)及其嵌入式系統(tǒng)7.5.1聯(lián)機手寫漢字識別系統(tǒng)7.5.2嵌入式聯(lián)機手寫識別系統(tǒng)7.6本章小結參考文獻第8章利用上下文信息的漢字識別后處理8.1概述8.2漢字識別后處理模型8.2.1漢字文本識別的整體模型8.2.2利用多層語言知識的漢字識別整體模型8.2.3整體模型的全局優(yōu)化8.2.4影響后處理性能的要素分析8.3統(tǒng)計語言模型8.3.1ngram模型的基本理論8.3.2基于字的語言模型8.3.3基于詞的語言模型8.4候選集的有效性8.4.1候選集大小分析8.4.2混淆矩陣獲取8.4.3擴充候選字集8.4.4詞條近似匹配算法8.5文本識別后處理的實現(xiàn)8.5.1字bigram模型的上下文處理8.5.2字trigram模型的上下文處理8.5.3詞bigram模型的上下文處理8.5.4字、詞相結合的上下文處理8.4.5利用上下文信息的漢字識別實驗系統(tǒng)8.6實驗結果與分析8.6.1實驗數(shù)據(jù)說明8.6.2語言模型的影響8.6.3候選字集的影響8.6.4文本識別混合后處理系統(tǒng)的影響8.7本章小結參考文獻第9章脫機手寫文檔識別方法9.1引言9.2文本行識別研究概況9.3基于過切分的脫機手寫中文文本行識別方法9.3.1脫機手寫中文文本行識別方法9.3.2基于分段的文本行識別搜索方法9.3.3文本行切分識別中的語言模型自適應9.3.4脫機手寫中文文本識別系統(tǒng)9.4基于HMM的無切分民族文字文檔識別方法9.4.1無切分識別方法的主要思想9.4.2無切分文檔識別方法中的特征提取9.4.3無切分文檔識別方法中的模型訓練9.4.4無切分文檔識別方法中的模型優(yōu)化9.4.5無切分文檔識別方法中的解碼識別9.4.6無切分維文文檔識別研究的相關實驗9.4.7小結9.5本章小結參考文獻第10章文檔版面自動分析和理解10.1版面處理的概念10.2版面分析研究的歷史和現(xiàn)狀10.2.1版面分析研究的分類10.2.2版面分析工作的發(fā)展10.2.3版面分析的困難10.3基于多層次基元的版面分析模型10.3.1多層次可信度的定義10.3.2多層次可信度指導下的自底向上版面分析算法10.3.3連通域?qū)哟?0.3.4行層次10.3.5區(qū)域?qū)哟?0.3.6頁面層次10.3.7實驗結果10.4版面理解和重構10.4.1版面理解和重構的需求10.4.2文檔結構模型10.4.3版面理解10.4.4版面重構10.4.5原文重現(xiàn)的電子出版物制作系統(tǒng)10.5本章小結 參考文獻第11章蒙藏維多文種識別11.1引言11.1.1蒙藏維文識別11.1.2民族文字識別的現(xiàn)狀11.1.3藏文及其識別11.1.4維吾爾文及其識別11.1.5蒙古文及其識別11.2蒙藏維文識別的基本策略11.2.1基本識別單元選擇11.2.2基本框架和關鍵技術11.3多文種民族文字識別中的字符規(guī)一化11.3.1基于基線分塊的民族字符規(guī)一化策略11.3.2規(guī)一化點陣大小選擇11.3.3位置規(guī)一化11.3.4基于三次B樣條函數(shù)的字符圖像插值11.3.5筆畫寬度調(diào)整11.4民族文字識別中的特征提取與特征變換11.4.1改進型方向線素特征11.4.2基于視覺特性的方向特征11.4.3基于線性鑒別分析的特征變換11.4.4實驗結果11.5民族文字識別中的級聯(lián)分類器設計11.5.1預分類11.5.2基于鑒別學習MQDF的主分類器11.5.3輔助分類11.5.4實驗結果11.6藏文文本切分和藏文識別后處理11.6.1藏文文本切分11.6.2拼寫規(guī)則與統(tǒng)計方法相結合的藏文識別后處理11.7多民族語言文字識別系統(tǒng)的實現(xiàn)——THOCR統(tǒng)一平臺民族文字識別系統(tǒng)11.7.1統(tǒng)一平臺多民族文字識別系統(tǒng)特點11.7.2維漢英混排民族文字的識別11.7.3蒙藏維多文種統(tǒng)一平臺識別系統(tǒng)性能11.7.4蒙藏維文檔識別的跨文種翻譯理解11.8本章小結參考文獻附錄A常用縮略語表附錄B文字識別相關研究成果附錄C文字識別相關成果主要獎勵附錄D已授權文字識別相關發(fā)明專利附錄E文字識別相關的博士論文附錄F本書中算法研究相關數(shù)據(jù)庫索引

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號