注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)挖掘/數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘?qū)嵺`:計(jì)算機(jī)科學(xué)叢書(shū)

數(shù)據(jù)挖掘?qū)嵺`:計(jì)算機(jī)科學(xué)叢書(shū)

數(shù)據(jù)挖掘?qū)嵺`:計(jì)算機(jī)科學(xué)叢書(shū)

定 價(jià):¥39.00

作 者: (美)Olivia Parr Rud著;朱揚(yáng)勇等譯;朱揚(yáng)勇譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 數(shù)據(jù)庫(kù)技術(shù)叢書(shū)
標(biāo) 簽: 數(shù)據(jù)庫(kù)存儲(chǔ)與管理

ISBN: 9787111122210 出版時(shí)間: 2003-09-01 包裝: 膠版紙
開(kāi)本: 26cm 頁(yè)數(shù): 314 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  OliviaParrRud是DataSquare,LLC的執(zhí)行副總裁。Olivia在金融服務(wù)行業(yè)已經(jīng)工作了二十多年,其中10年專門從事信用卡、保險(xiǎn)、電信、零售、度假業(yè)、名錄服務(wù)行業(yè)的數(shù)據(jù)挖掘、建模和劃分工作。利用自己分析能力與創(chuàng)造才華,她提供客戶獲取、模型維護(hù)、風(fēng)險(xiǎn)、總盈利等方面的分析和解決方案。本書(shū)詳細(xì)介紹了一種新的數(shù)據(jù)挖掘技術(shù)—數(shù)據(jù)建模,并著重闡述整個(gè)模型開(kāi)發(fā)過(guò)程的細(xì)節(jié)。本書(shū)包括三個(gè)部分。第一部分講述了基礎(chǔ)知識(shí),內(nèi)容涉及確定目標(biāo)和從商業(yè)預(yù)測(cè)中定義目標(biāo)的重要性,并給出了收集數(shù)據(jù)和創(chuàng)建數(shù)據(jù)集的例子。第二部分通過(guò)一實(shí)例詳?shù)殛U述了模型開(kāi)發(fā)的整個(gè)過(guò)程。第三部分通過(guò)應(yīng)用于保險(xiǎn)業(yè)、銀行、電信行業(yè)的實(shí)例詳細(xì)說(shuō)明了不同目標(biāo)的數(shù)據(jù)建模過(guò)程中的幾個(gè)關(guān)鍵步驟。本書(shū)將數(shù)據(jù)挖掘的技藝用飲食烹調(diào)的思?爰右在故?,易诱O斫?,遍斦V郵堋J櫓懈齙鬧詼嗍道浞痔逑至俗髡叨嗄甑男幸稻?,毒壉前的手C∮涂突Ч叵倒芾斫>哂屑訓(xùn)慕杓饔謾1臼槭屎暇哂幸歡ǖ耐臣坪頭治黿;〉畝琳咴畝?,可作为分析师、数据驼a蛉嗽?、营销经理的工佐|植?,也可作为紦溷机相关专覚n謀究粕?,研究生綖┠幌娿^潿廖鎩?"什么是數(shù)據(jù)挖掘數(shù)據(jù)挖掘(datamining)這個(gè)術(shù)語(yǔ)涵蓋了應(yīng)用于各個(gè)行業(yè)的多種技術(shù)。由于市場(chǎng)份額和利潤(rùn)競(jìng)爭(zhēng)的日趨激烈,數(shù)據(jù)挖掘成為公司在客戶生命周期的各個(gè)階段維持競(jìng)爭(zhēng)力的必要工具。過(guò)去,數(shù)據(jù)挖掘的形式之一也稱為數(shù)據(jù)捕撈(datadredging)。這種方法曾被認(rèn)為沒(méi)有達(dá)到合格的研究標(biāo)準(zhǔn)。也就是說(shuō),研究人員實(shí)際上可能沒(méi)有作任何預(yù)定義的假設(shè)就開(kāi)始研究所有的數(shù)據(jù)。然而,由于這種形式的數(shù)據(jù)挖掘確實(shí)可以發(fā)現(xiàn)有價(jià)值的信息,所以它開(kāi)始被廣為接受。在美國(guó)的公司里,如果有一種方法可以發(fā)現(xiàn)如何提高利潤(rùn),那么人們會(huì)迅速地接受、信賴它。20世紀(jì)80年代末至90年代初,另一種形式的數(shù)據(jù)挖掘開(kāi)始在營(yíng)銷領(lǐng)域流行起來(lái)。幾個(gè)技術(shù)領(lǐng)先的信用卡銀行發(fā)現(xiàn),有一種新的稱為數(shù)據(jù)建模(datamodeling)的數(shù)據(jù)挖掘技術(shù)可以提高獲得客戶的能力,改進(jìn)風(fēng)險(xiǎn)管理。大量的活動(dòng)和空前的增長(zhǎng)為數(shù)據(jù)建模的繁榮發(fā)展提供了肥沃的土壤。數(shù)據(jù)建模的成功和它所帶來(lái)的利潤(rùn)為它在其他行業(yè)的應(yīng)用鋪平了道路。目前,使用數(shù)據(jù)建模技術(shù)進(jìn)行營(yíng)銷的行業(yè)包括保險(xiǎn)業(yè)、零售業(yè)、投資銀行、公共事業(yè)部門、電信業(yè)、能源業(yè)、度假業(yè)、游戲業(yè)和藥品行業(yè)等等。本書(shū)的重點(diǎn)許多統(tǒng)計(jì)理論的書(shū)都談到了數(shù)據(jù)建模技術(shù)。但本書(shū)并不是那樣的一本書(shū)!本書(shū)討論的重點(diǎn)是在營(yíng)銷、風(fēng)險(xiǎn)和客戶關(guān)系管理(CRM)中使用這些技術(shù)所需的實(shí)踐知識(shí)。大部分公司都被數(shù)據(jù)挖掘軟件工具?鬧擲嗪凸δ芘醚芻ㄧ月?lián)uH砑潭忌撲塹娜砑恰耙子謔褂謾焙汀拔扌樅魏畏治黽寄堋鋇?。但薁楷晤U且言詒玖煊蜆ぷ鞫嗄輳勒廡┕愀媸遣蛔鬮諾?。任褐^O钅康某曬Σ喚黿鋈【鲇詼雜詵椒ㄑУ牧己美斫?,还取决釉溤数臼n⑹諧「駝逕桃的勘甑睦斫?。事实上,峨s謖齬潭?,模型揣f砉討皇瞧渲械囊恍〔糠幀?本書(shū)將著重闡述整個(gè)模型開(kāi)發(fā)的過(guò)程。討論的內(nèi)容包括對(duì)商業(yè)或市場(chǎng)的預(yù)測(cè),以及處理過(guò)程中所需的復(fù)雜的SAS代碼。這是為了強(qiáng)調(diào)實(shí)際模型處理過(guò)程之前與之后的步驟的重要性。本書(shū)的讀者隨著數(shù)據(jù)挖掘應(yīng)用的飛速發(fā)展,對(duì)資深分析師和數(shù)據(jù)挖掘師的需求也增加了。但是,由于此類人才短缺,公司便雇用有才華的統(tǒng)計(jì)學(xué)家或初級(jí)分析師,他們懂技術(shù),但是缺乏必要的商業(yè)敏感性。公司也可能會(huì)購(gòu)買復(fù)雜的數(shù)據(jù)挖掘軟件工具,這些工具所提供的解決方案對(duì)分析技術(shù)知識(shí),或者與目標(biāo)相關(guān)的業(yè)務(wù)知識(shí)都知之甚少。不管是哪種情況,都有可能缺乏某些領(lǐng)域的知識(shí),如定義目標(biāo)的結(jié)構(gòu),獲取和準(zhǔn)備數(shù)據(jù),確認(rèn)和應(yīng)用模型以及測(cè)量結(jié)果等。任何一個(gè)領(lǐng)域的錯(cuò)誤都可能是災(zāi)難性的,會(huì)造成巨大的浪費(fèi)。本書(shū)可作為不同級(jí)別的分析師、數(shù)據(jù)挖掘人員和營(yíng)銷經(jīng)理的工作手冊(cè)。本書(shū)提供了數(shù)據(jù)建模的逐步指導(dǎo),尤其強(qiáng)調(diào)了必要的商業(yè)知識(shí),以得到有益的結(jié)果。對(duì)于那些數(shù)據(jù)挖掘的初學(xué)者,本書(shū)可作為整個(gè)過(guò)程的綜合指導(dǎo)。對(duì)于經(jīng)驗(yàn)豐富的分析師而言,本書(shū)可以作為參考手冊(cè)。最后,對(duì)于管理人員而言,閱讀本書(shū)可以對(duì)成功運(yùn)用數(shù)據(jù)模型所需的技術(shù)與過(guò)程有基本的了解。本書(shū)的結(jié)構(gòu)本書(shū)分為三個(gè)部分。第一部分講述基礎(chǔ)知識(shí)。第1章討論了確定目標(biāo)和從商業(yè)角度定義目標(biāo)的重要性。第2章討論并提供了大量的例子,其中包括收集數(shù)據(jù)和創(chuàng)建建模數(shù)據(jù)集。第二部分通過(guò)一個(gè)案例研究,詳細(xì)闡述了模型開(kāi)發(fā)過(guò)程的每個(gè)步驟。第3章-第7章討論了數(shù)據(jù)清洗、變量歸約和轉(zhuǎn)換、模型處理、驗(yàn)證、實(shí)施的步驟。第三部分提供一系列的案例研究,這些案例分別應(yīng)用于保險(xiǎn)業(yè)、銀行、電信等行業(yè),詳細(xì)說(shuō)明了不同目標(biāo)的數(shù)據(jù)建模過(guò)程的幾個(gè)關(guān)鍵步驟,包括特征、響應(yīng)、風(fēng)險(xiǎn)和生命周期值。隨著本書(shū)對(duì)模型開(kāi)發(fā)步驟的深入探討,作者加進(jìn)了幾位業(yè)內(nèi)專家的合理建議,他們都是數(shù)據(jù)挖掘領(lǐng)域的先鋒。這些建議對(duì)某個(gè)主題提出了不同看法,如多重共線性,建立生命周期值模型的其他方法等。所需工具要使用本書(shū)提供解決方案,讀者要對(duì)統(tǒng)計(jì)學(xué)有基本的了解。如果你的目標(biāo)是要得到管理層數(shù)據(jù)建模的使用建議,則需要進(jìn)行準(zhǔn)確的商業(yè)判斷。本書(shū)所有的代碼示例都是用SAS寫的,為了在SAS上實(shí)現(xiàn)這些代碼,用戶需要BaseSAS和SAS/STAT。電子數(shù)據(jù)表都是用微軟的Excel做成的。但是,基本的邏輯和指令對(duì)所有的軟件包和建模工具都是有效的。配套光盤本書(shū)從第3章—第13章都包含了開(kāi)發(fā)、驗(yàn)證和實(shí)施數(shù)據(jù)模型的SAS代碼。對(duì)這些代碼稍做修改,再加上一些常識(shí),就能夠從數(shù)據(jù)準(zhǔn)備階段到模型的開(kāi)發(fā)與驗(yàn)證階段建立一個(gè)模型。但是,這樣需要大量的時(shí)間,還有可能出現(xiàn)編碼錯(cuò)誤。為了簡(jiǎn)化這項(xiàng)工作并使代碼更容易地用于不同的數(shù)據(jù)模型,原出版社出版了配套光盤,但需要讀者另行購(gòu)買。光盤里包括了開(kāi)發(fā)不同模型所需的全部代碼,模型包括:響應(yīng)、驗(yàn)證、流失、風(fēng)險(xiǎn)、生命周期值或凈現(xiàn)值。開(kāi)發(fā)目標(biāo)函數(shù)的具體代碼包括信用卡、保險(xiǎn)、電信、名錄服務(wù)的例子。代碼中有清楚的注釋,解釋了每一個(gè)步驟的目的與方法,所需要的軟件是BaseSAS和SAS/STAT。用于創(chuàng)建收益表和增幅圖的電子數(shù)據(jù)表也包含在光盤中。通過(guò)SAS創(chuàng)建的初步分析結(jié)果可以得到這些表并加以使用。既然模型處理前后的步驟可以結(jié)合任何數(shù)據(jù)模型軟件包來(lái)使用,代碼自然也可以作為獨(dú)立的建模模板。模型處理步驟重點(diǎn)在于邏輯遞歸上的數(shù)據(jù)準(zhǔn)備。光盤上還包括用于變量驗(yàn)證和處理的SAS宏。本書(shū)沒(méi)有涵蓋的內(nèi)容一本數(shù)據(jù)挖掘的書(shū)如果沒(méi)有提到隱私權(quán),那么就不能算是完整。我相信這是數(shù)據(jù)挖掘工作者的一項(xiàng)重要的工作。關(guān)于這個(gè)話題,可以再寫一本書(shū)。所以,本書(shū)中沒(méi)有談到這一點(diǎn)。但是,我希望所有使用個(gè)人數(shù)據(jù)進(jìn)行營(yíng)銷的公司都能制訂一項(xiàng)隱私權(quán)的法規(guī)。要獲得更進(jìn)一步的信息和指導(dǎo),請(qǐng)與DirectMarketingAssociation聯(lián)系,電話(212)790-1500,或者訪問(wèn)他們的網(wǎng)站http://www.the-dma.org。小結(jié)有效的數(shù)據(jù)挖掘是科學(xué)與藝術(shù)的復(fù)雜混合體。數(shù)據(jù)挖掘工具的數(shù)量每年都在增長(zhǎng)。研究人員不斷開(kāi)發(fā)新方法,軟件廠商實(shí)現(xiàn)現(xiàn)有的方法,才華橫溢的分析師則利用標(biāo)準(zhǔn)技術(shù)來(lái)推進(jìn)過(guò)程。數(shù)據(jù)挖掘(說(shuō)得具體一點(diǎn),數(shù)據(jù)建模)已經(jīng)成為公司維持利潤(rùn)的戰(zhàn)略必備工具。希望本書(shū)可以成為你實(shí)現(xiàn)數(shù)據(jù)挖掘目標(biāo)時(shí)方便的參考和恰當(dāng)?shù)南驅(qū)А?quot;

作者簡(jiǎn)介

  OliviaParrRud是DataSquare,LLC的執(zhí)行副總裁。Olivia在金融服務(wù)行業(yè)已經(jīng)工作了二十多年,其中10年專門從事信用卡、保險(xiǎn)、電信、零售、度假業(yè)、名錄服務(wù)行業(yè)的數(shù)據(jù)挖掘、建模和劃分工作。利用自己分析能力與創(chuàng)造才華,她提供客戶獲取、模型維護(hù)、風(fēng)險(xiǎn)、總盈利等方面的分析和解決方案。

圖書(shū)目錄

譯者序
對(duì)本書(shū)的贊譽(yù)

前言
作者介紹
第一部分 計(jì)劃菜單
第1章 設(shè)立目標(biāo)
1.1 定義目標(biāo)
1.1.1 特征分析
1.1.2 劃分
1.1.3 響應(yīng)
1.1.4 風(fēng)險(xiǎn)
1.1.5 激活
1.1.6 交叉銷售和提升銷售
1.1.7 流失
1.1.8 凈現(xiàn)值
1.1.9 生命周期價(jià)值
1.2 選擇建模方法
1.2.1 線性回歸
1.2.2 邏輯回歸
1.2.3 神經(jīng)網(wǎng)絡(luò)
1.2.4 遺傳算法
1.2.5 分類樹(shù)
1.3 自適應(yīng)公司
1.3.1 雇傭和合作
1.3.2 以產(chǎn)品為中心與以客戶為中心
1.4 小結(jié)
第2章 選擇數(shù)據(jù)源
2.1 數(shù)據(jù)類型
2.1.1 人口統(tǒng)計(jì)學(xué)數(shù)據(jù)一般描述個(gè)人或家庭特征
2.1.2 行為數(shù)據(jù)是行動(dòng)或行為的一種度量
2.1.3 心理或態(tài)度數(shù)據(jù)以觀點(diǎn)、生活方式
2.2 數(shù)據(jù)源
2.2.1 內(nèi)部數(shù)據(jù)源
2.2.2 外部數(shù)據(jù)源
2.3 選擇建模數(shù)據(jù)
2.3.1 潛在客戶數(shù)據(jù)
2.3.2 客戶模型數(shù)據(jù)
2.3.3 風(fēng)險(xiǎn)模型數(shù)據(jù)
2.4 構(gòu)造建模數(shù)據(jù)集
2.4.1 如何確定樣本尺寸
2.4.2 采樣方法
2.4.3 根據(jù)已建立模型的數(shù)據(jù)開(kāi)發(fā)模型
2.4.4 集成多個(gè)宣傳活動(dòng)的數(shù)據(jù)
2.5 小結(jié)
第二部分 烹調(diào)演示
第3章 準(zhǔn)備數(shù)據(jù)
3.1 訪問(wèn)數(shù)據(jù)
3.1.1 數(shù)據(jù)分類
3.1.2 讀原始數(shù)據(jù)
3.2 創(chuàng)建建模數(shù)據(jù)集
3.3 清理數(shù)據(jù)
3.3.1 連續(xù)變量
3.3.2 類型變量
3.4 小結(jié)
第4章 選擇及轉(zhuǎn)換變量
4.1 定義目標(biāo)函數(shù)
4.1.1 激活概率
4.1.2 風(fēng)險(xiǎn)指數(shù)
4.1.3 產(chǎn)品收益率
4.1.4 營(yíng)銷費(fèi)用
4.2 派生變量
4.2.1 概化
4.2.2 比率
4.2.3 日期
4.3 變量歸約
4.3.1 連續(xù)變量
4.3.2 類別變量
4.4 開(kāi)發(fā)線性預(yù)測(cè)因子
4.4.1 連續(xù)變量
4.4.2 類別變量
4.5 相互作用檢測(cè)
4.6 小結(jié)
第5章 處理和評(píng)價(jià)模型
5.1 處理模型
5.1.1 分割數(shù)據(jù)
5.1.2 方法1:?jiǎn)文P?br />5.1.3 方法2:雙模型——響應(yīng)
5.1.4 方法2:雙模型——激活
5.1.5 方法1與方法2的比較
5.2 小結(jié)
第6章 驗(yàn)證模型
6.1 收益表與收益圖
6.1.1 方法1:?jiǎn)文P?br />6.1.2 方法2:雙模型
6.2 為備用數(shù)據(jù)集評(píng)分
6.3 重新采樣
6.3.1 折疊
6.3.2 自引導(dǎo)
6.4 關(guān)鍵變量的十分位數(shù)分析
6.5 小結(jié)
第7章 實(shí)施與維護(hù)模型
7.1 為新文件評(píng)分
7.1.1 內(nèi)部評(píng)分
7.1.2 外部評(píng)分與審計(jì)
7.2 實(shí)施模型
7.2.1 計(jì)算機(jī)財(cái)務(wù)狀況
7.2.2 決定文件分割點(diǎn)
7.2.3 衛(wèi)冕者與挑戰(zhàn)者
7.2.4 雙模型矩陣
7.3 模型跟蹤
7.4 模型維護(hù)
7.4.1 模型壽命
7.4.2 模型記錄
7.5 小結(jié)
第三部分 每個(gè)節(jié)日的菜肴配方
第8章 了解你的客戶:特征化和劃分
8.1 為什么了解客戶很重要
8.2 目錄服務(wù)公司客戶的特征化昨滲透分析
8.2.1 RFM分析
8.2.2 滲透分析
8.3 為信用卡公司開(kāi)發(fā)客戶價(jià)值矩陣
8.4 執(zhí)行聚類分析以發(fā)現(xiàn)客戶劃分
8.5 小結(jié)
第9章 定位新的潛在客戶:響應(yīng)建模
9.1 定義目標(biāo)
9.2 準(zhǔn)備變更
9.2.1 連續(xù)變量
9.2.2 類別變量
9.3 處理模型
9.4 用自引導(dǎo)驗(yàn)證
9.5 實(shí)現(xiàn)模型
9.6 小結(jié)
第10章 避免高風(fēng)險(xiǎn)客戶:風(fēng)險(xiǎn)建模
10.1 信用評(píng)分和風(fēng)險(xiǎn)建模
10.2 定義目標(biāo)
10.3 準(zhǔn)備變量
10.4 處理模型
10.5 驗(yàn)證模型
10.6 實(shí)現(xiàn)模型
10.7 另一種風(fēng)險(xiǎn):欺詐
10.8 小結(jié)
第11章 留信創(chuàng)利客戶:流失建模
11.1 客戶忠誠(chéng)度
11.2 定義目標(biāo)
11.3 準(zhǔn)備變量
11.3.1 連續(xù)變量
11.3.2 類型變量
11.4 處理模型
11.5 驗(yàn)證模型
11.6 實(shí)現(xiàn)模型
11.6.1 建立流失客戶特征
11.6.2 優(yōu)化客戶創(chuàng)利能力
11.6.3 提前保留客戶
11.7 小結(jié)
第12章 定位創(chuàng)利客戶:生命周期價(jià)值建模
12.1 什么是生命周期價(jià)值
12.1.1 使用生命周期價(jià)值
12.1.2 生命周期價(jià)值的組成
12.2 生命周期價(jià)值的應(yīng)用
12.3 為可續(xù)約產(chǎn)品或服務(wù)計(jì)算生命周期價(jià)值
12.4 計(jì)算機(jī)生命周期價(jià)值:案例研究
12.4.1 案例研究:第一年凈收入
12.4.2 生命周期價(jià)值計(jì)算
12.5 小結(jié)
第13章 快餐:Web建模
13.1 Web挖掘和Web建模
13.1.1 定義目標(biāo)
13.1.2 Web數(shù)據(jù)源
13.1.3 準(zhǔn)備Web數(shù)據(jù)
13.1.4 選擇方法學(xué)
13.2 在Web上建立品牌
13.3 實(shí)時(shí)洞察客戶
13.4 Web使用挖掘——案例分析
13.5 小結(jié)
附錄A 連續(xù)變量的單變量分析
附錄B 類別變量的單變量分析
附錄C 推薦閱讀教材

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)