基于潛在語義的個(gè)性化搜索關(guān)鍵技術(shù)研究

定　價(jià)：￥36.00

作　者：	陳冬玲著
出版社：	中國水利水電出版社
叢編項(xiàng)：
標(biāo)　簽：	暫缺

購買這本書可以去

京東 (￥31.00)

ISBN：	9787517010319	出版時(shí)間：	2013-08-01	包裝：	平裝
開本：	16開	頁數(shù)：	141	字?jǐn)?shù)：

內(nèi)容簡介

《基于潛在語義的個(gè)性化搜索關(guān)鍵技術(shù)研究》包括以下幾個(gè)方面：
　?。?）在計(jì)算機(jī)研究領(lǐng)域內(nèi)，從哲學(xué)、心理學(xué)角度剖析用戶搜索行為，并從認(rèn)知學(xué)的角度，提出了基于概率潛在語義動(dòng)機(jī)分析的用戶行為模型，高度概括了各種具體搜索行為，從抽象的角度去理解用戶的搜索行為。該模型的提出為進(jìn)一步研究個(gè)性化搜索提供了新的思路。
　?。?）在文檔潛在語義空間中，應(yīng)用Zipf分布與概率潛在語義分析算法相結(jié)合的方式進(jìn)行文檔潛在主題提取，改善了文檔潛在主題提取的質(zhì)量。
　?。?）以狄氏先驗(yàn)的有限混合模型理論為基礎(chǔ)，提出了高效無監(jiān)督的網(wǎng)頁聚類算法?？梢杂行Э朔话愕奈谋揪垲愃惴o法有效應(yīng)對(duì)的高維性、稀疏性文本，以及文本數(shù)據(jù)之間的相似性函數(shù)定義困難，聚類質(zhì)量和效率低等不足，改善了聚類效果，提高了捕獲用戶興趣潛在主題需求的能力。
　?。?）提出了一種新的基于用戶潛在語義分析的查詢擴(kuò)展技術(shù)。即將通用搜索中查詢擴(kuò)展的技術(shù)與用戶動(dòng)機(jī)挖掘技術(shù)相結(jié)合，而開發(fā)出的一種新的查詢擴(kuò)展技術(shù)，解決了搜索引擎由于通用的性質(zhì)而缺乏面向用戶的個(gè)性化的信息處理的能力，從了解用戶的語義上的搜索動(dòng)機(jī)以及了解認(rèn)知與心理相互作用的角度出發(fā)，從根本上解決了查詢過程中的一詞多義及多詞同義等問題，在個(gè)性化搜索過程中有效的進(jìn)行語義消歧。
　?。?）針對(duì)面向查詢的排名算法的不足提出了面向用戶的重排名算法。即在原有網(wǎng)頁排序算法的基礎(chǔ)上，根據(jù)用戶的興趣偏好而提出的一種局部優(yōu)化排序算法，既符合用戶的個(gè)性化需求，又不影響搜索結(jié)果的查全率，盡可能做到其排序結(jié)果與用戶語義動(dòng)機(jī)相符合。

作者簡介

陳冬玲，女，漢族，1973年12月生于吉林省四平市。1992年考入東北帥范大學(xué)計(jì)算機(jī)科學(xué)系計(jì)算機(jī)教育專業(yè)，1996年7月畢業(yè)，獲得理學(xué)學(xué)士學(xué)位。同年，到沈陽大學(xué)師范學(xué)院任教，教授計(jì)算機(jī)專業(yè)課程：“匯編語言”、“數(shù)據(jù)結(jié)構(gòu)”、“數(shù)據(jù)庫原理”等。并于2002年9月考取東北大學(xué)信息與工程學(xué)院計(jì)算機(jī)應(yīng)用專業(yè)碩士，于2005年7月畢業(yè)并獲碩士學(xué)位，同年考取東北大學(xué)信息與工程學(xué)院計(jì)算機(jī)軟件與理論專業(yè)博士研究生。
　　在攻讀博士期間，一直致力于用戶行為分析與動(dòng)機(jī)挖掘工作，曾作為主要參與人員參加國家自然基金課題（No.60573090）“面向新一代搜索引擎的用戶動(dòng)機(jī)推演模型的研究”，2006.1～2008.12，并作為主要參與人員參加遼寧省自然科學(xué)基金項(xiàng)目（No.20062032）“新一代搜索引擎中用戶模型關(guān)鍵技術(shù)的研究”，2006.10-2008.12。
　　攻讀博士期間還發(fā)表多篇文章，包括APWEB/WAIM2007、DEWEB2008.Joumal of Computational In for mation System、東北大學(xué)學(xué)報(bào)（自然科學(xué)版），小型微型計(jì)算機(jī)系統(tǒng)等著名國際會(huì)議和國內(nèi)著名雜志論文。其中，第一作者EI索引論文5篇，ISTP索引的論文3篇。

圖書目錄

前言
第1章緒論
1.1 搜索引擎體系結(jié)構(gòu)及功能
1.1.1 信息的收集
1.1.2 信息預(yù)處理
1.1.3 查詢服務(wù)
1.2 個(gè)性化搜索引擎
1.2.1 個(gè)性化搜索引擎的體系結(jié)構(gòu)
1.2.2 個(gè)性化搜索關(guān)鍵技術(shù)
1.2.3 個(gè)性化搜索研究現(xiàn)狀
1.2.4 個(gè)性化搜索面臨的問題與挑戰(zhàn)
1.3 本文研究的主要內(nèi)容
1.4 本文的組織結(jié)構(gòu)

第2章基于概率潛在語義的用戶模型構(gòu)造
2.1 問題提出
2.2 用戶模型研究綜述
2.2.1 用戶模型的創(chuàng)建技術(shù)研究
2.2.2 用戶模型的學(xué)習(xí)與更新技術(shù)研究
2.2.3 用戶模型應(yīng)用技術(shù)的研究
2.3 用戶搜索行為的理論分析
2.3.1 從認(rèn)知角度分析用戶的搜索行為
2.3.2 用戶搜索行為的不確定性
2.3.3 用戶搜索行為分析的邏輯框架
2.4 用戶動(dòng)機(jī)分析的兩類不確定問題
2.5 基于PLSA的潛在概念獲取與用戶模型構(gòu)建
2.5.1 概率潛在語義分析
2.5.2 潛在語義空間的Zipf分布
2.5.3 基于PLSA的用戶動(dòng)機(jī)建模
2.5.4 用戶模型的學(xué)習(xí)與更新
2.6 實(shí)驗(yàn)及評(píng)價(jià)
2.6.1 數(shù)據(jù)集
2.6.2 評(píng)價(jià)標(biāo)準(zhǔn)
2.6.3 實(shí)驗(yàn)結(jié)果及分析
2.7 本章小結(jié)

第3章基于有限混合模型的文本聚類
3.1 問題提出
3.2 傳統(tǒng)聚類算法的概述
3.2.1 基于相似性的聚類方法
3.2.2 基于模型的聚類
3.2.3 各類算法的對(duì)比分析
3.3 傳統(tǒng)聚類方式在個(gè)性化搜索中存在的問題
3.4 基于有限混合主題模型的文檔聚類分析
3.4.1 有限混合模型
3.4.2 EM算法
3.4.3 基于有限混合模型的文檔聚類
3.5 實(shí)驗(yàn)及評(píng)價(jià)
3.5.1 實(shí)驗(yàn)數(shù)據(jù)集
3.5.2 評(píng)價(jià)標(biāo)準(zhǔn)
3.5.3 實(shí)驗(yàn)結(jié)果及分析
3.6 本章小結(jié)

第4章基于用戶潛在語義動(dòng)機(jī)的查詢擴(kuò)展
4.1 問題提出
4.2 現(xiàn)有的查詢擴(kuò)展方法概述
4.2.1 基于大規(guī)模語料庫的查詢擴(kuò)展方法
4.2.2 基于語義關(guān)系／語義結(jié)構(gòu)的查詢擴(kuò)展方法
4.3 目前查詢擴(kuò)展方法的不足
4.4 基于潛在語義動(dòng)機(jī)的查詢擴(kuò)展
4.4.1 ULSM-QE的框架
4.4.2 查詢?cè)~處理
4.4.3 查詢語義動(dòng)機(jī)分析
4.4.4 相關(guān)度計(jì)算
4.4.5 查詢?cè)~的語義消歧
4.4.6 生成新查詢
4.5 實(shí)驗(yàn)及評(píng)價(jià)
4.5.1 數(shù)據(jù)集
4.5.2 評(píng)價(jià)標(biāo)準(zhǔn)
4.5.3 實(shí)驗(yàn)結(jié)果及分析
4.6 本章小結(jié)

第5章基于用戶偏好的網(wǎng)頁排序局部優(yōu)化策略
5.1 問題提出
5.2 傳統(tǒng)網(wǎng)頁排序算法介紹
5.2.1 PageRank算法及其衍生算法
5.2.2 HITS算法
5.3 傳統(tǒng)排序算法存在的問題
5.4 基于用戶偏好的網(wǎng)頁排序
5.4.1 UP-PR.框架
5.4.2 查詢?cè)~的主題分類
5.4.3 網(wǎng)頁的主題分類
5.4.4 參數(shù)的選擇
5.5 實(shí)驗(yàn)及評(píng)價(jià)
5.5.1 數(shù)據(jù)集
5.5.2 評(píng)價(jià)標(biāo)準(zhǔn)
5.5.3 實(shí)驗(yàn)結(jié)果及分析
5.6 本章小結(jié)

第6章結(jié)論
6.1 本文的主要貢獻(xiàn)與結(jié)論
6.2 進(jìn)一步的工作
參考文獻(xiàn)
作者簡介