注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書人文社科社會科學信息與知識傳播基于潛在語義的個性化搜索關鍵技術研究

基于潛在語義的個性化搜索關鍵技術研究

基于潛在語義的個性化搜索關鍵技術研究

定 價:¥36.00

作 者: 陳冬玲 著
出版社: 中國水利水電出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787517010319 出版時間: 2013-08-01 包裝: 平裝
開本: 16開 頁數: 141 字數:  

內容簡介

《基于潛在語義的個性化搜索關鍵技術研究》包括以下幾個方面:
 ?。?)在計算機研究領域內,從哲學、心理學角度剖析用戶搜索行為,并從認知學的角度,提出了基于概率潛在語義動機分析的用戶行為模型,高度概括了各種具體搜索行為,從抽象的角度去理解用戶的搜索行為。該模型的提出為進一步研究個性化搜索提供了新的思路。
 ?。?)在文檔潛在語義空間中,應用Zipf分布與概率潛在語義分析算法相結合的方式進行文檔潛在主題提取,改善了文檔潛在主題提取的質量。
  (3)以狄氏先驗的有限混合模型理論為基礎,提出了高效無監(jiān)督的網頁聚類算法。可以有效克服一般的文本聚類算法無法有效應對的高維性、稀疏性文本,以及文本數據之間的相似性函數定義困難,聚類質量和效率低等不足,改善了聚類效果,提高了捕獲用戶興趣潛在主題需求的能力。
 ?。?)提出了一種新的基于用戶潛在語義分析的查詢擴展技術。即將通用搜索中查詢擴展的技術與用戶動機挖掘技術相結合,而開發(fā)出的一種新的查詢擴展技術,解決了搜索引擎由于通用的性質而缺乏面向用戶的個性化的信息處理的能力,從了解用戶的語義上的搜索動機以及了解認知與心理相互作用的角度出發(fā),從根本上解決了查詢過程中的一詞多義及多詞同義等問題,在個性化搜索過程中有效的進行語義消歧。
 ?。?)針對面向查詢的排名算法的不足提出了面向用戶的重排名算法。即在原有網頁排序算法的基礎上,根據用戶的興趣偏好而提出的一種局部優(yōu)化排序算法,既符合用戶的個性化需求,又不影響搜索結果的查全率,盡可能做到其排序結果與用戶語義動機相符合。

作者簡介

陳冬玲,女,漢族,1973年12月生于吉林省四平市。1992年考入東北帥范大學計算機科學系計算機教育專業(yè),1996年7月畢業(yè),獲得理學學士學位。同年,到沈陽大學師范學院任教,教授計算機專業(yè)課程:“匯編語言”、“數據結構”、“數據庫原理”等。并于2002年9月考取東北大學信息與工程學院計算機應用專業(yè)碩士,于2005年7月畢業(yè)并獲碩士學位,同年考取東北大學信息與工程學院計算機軟件與理論專業(yè)博士研究生。
  在攻讀博士期間,一直致力于用戶行為分析與動機挖掘工作,曾作為主要參與人員參加國家自然基金課題(No.60573090)“面向新一代搜索引擎的用戶動機推演模型的研究”,2006.1~2008.12,并作為主要參與人員參加遼寧省自然科學基金項目(No.20062032)“新一代搜索引擎中用戶模型關鍵技術的研究”,2006.10-2008.12。
  攻讀博士期間還發(fā)表多篇文章,包括APWEB/WAIM2007、DEWEB2008.Joumal of Computational In for mation System、東北大學學報(自然科學版),小型微型計算機系統等著名國際會議和國內著名雜志論文。其中,第一作者EI索引論文5篇,ISTP索引的論文3篇。

圖書目錄

前言
第1章 緒論
1.1 搜索引擎體系結構及功能
1.1.1 信息的收集
1.1.2 信息預處理
1.1.3 查詢服務
1.2 個性化搜索引擎
1.2.1 個性化搜索引擎的體系結構
1.2.2 個性化搜索關鍵技術
1.2.3 個性化搜索研究現狀
1.2.4 個性化搜索面臨的問題與挑戰(zhàn)
1.3 本文研究的主要內容
1.4 本文的組織結構

第2章 基于概率潛在語義的用戶模型構造
2.1 問題提出
2.2 用戶模型研究綜述
2.2.1 用戶模型的創(chuàng)建技術研究
2.2.2 用戶模型的學習與更新技術研究
2.2.3 用戶模型應用技術的研究
2.3 用戶搜索行為的理論分析
2.3.1 從認知角度分析用戶的搜索行為
2.3.2 用戶搜索行為的不確定性
2.3.3 用戶搜索行為分析的邏輯框架
2.4 用戶動機分析的兩類不確定問題
2.5 基于PLSA的潛在概念獲取與用戶模型構建
2.5.1 概率潛在語義分析
2.5.2 潛在語義空間的Zipf分布
2.5.3 基于PLSA的用戶動機建模
2.5.4 用戶模型的學習與更新
2.6 實驗及評價
2.6.1 數據集
2.6.2 評價標準
2.6.3 實驗結果及分析
2.7 本章小結

第3章 基于有限混合模型的文本聚類
3.1 問題提出
3.2 傳統聚類算法的概述
3.2.1 基于相似性的聚類方法
3.2.2 基于模型的聚類
3.2.3 各類算法的對比分析
3.3 傳統聚類方式在個性化搜索中存在的問題
3.4 基于有限混合主題模型的文檔聚類分析
3.4.1 有限混合模型
3.4.2 EM算法
3.4.3 基于有限混合模型的文檔聚類
3.5 實驗及評價
3.5.1 實驗數據集
3.5.2 評價標準
3.5.3 實驗結果及分析
3.6 本章小結

第4章 基于用戶潛在語義動機的查詢擴展
4.1 問題提出
4.2 現有的查詢擴展方法概述
4.2.1 基于大規(guī)模語料庫的查詢擴展方法
4.2.2 基于語義關系/語義結構的查詢擴展方法
4.3 目前查詢擴展方法的不足
4.4 基于潛在語義動機的查詢擴展
4.4.1 ULSM-QE的框架
4.4.2 查詢詞處理
4.4.3 查詢語義動機分析
4.4.4 相關度計算
4.4.5 查詢詞的語義消歧
4.4.6 生成新查詢
4.5 實驗及評價
4.5.1 數據集
4.5.2 評價標準
4.5.3 實驗結果及分析
4.6 本章小結

第5章 基于用戶偏好的網頁排序局部優(yōu)化策略
5.1 問題提出
5.2 傳統網頁排序算法介紹
5.2.1 PageRank算法及其衍生算法
5.2.2 HITS算法
5.3 傳統排序算法存在的問題
5.4 基于用戶偏好的網頁排序
5.4.1 UP-PR.框架
5.4.2 查詢詞的主題分類
5.4.3 網頁的主題分類
5.4.4 參數的選擇
5.5 實驗及評價
5.5.1 數據集
5.5.2 評價標準
5.5.3 實驗結果及分析
5.6 本章小結

第6章 結論
6.1 本文的主要貢獻與結論
6.2 進一步的工作
參考文獻
作者簡介

本目錄推薦

掃描二維碼
Copyright ? 讀書網 m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號