客戶1和客戶2 均與不止一家公司進(jìn)行交易,但是他們的購買份額并沒有平均分配給與其有交易的各家公司。在這種情況下,我們不會(huì)知道他們具體的流失時(shí)間,許多消費(fèi)品的采購都屬于這種類型。在這種方式中,被用來建模的并不是客戶流失的時(shí)間,而是與每家公司或每種品牌相關(guān)的客戶轉(zhuǎn)移概率。遷移模型和馬爾科夫(Markov)模型通常都是用來估算客戶轉(zhuǎn)移概率的模型。
廣泛應(yīng)用的流失模型
在上述不輕易轉(zhuǎn)變型的方式中,模型預(yù)測(cè)了客戶流失的概率。在眾多能夠預(yù)測(cè)客戶流失概率的模型當(dāng)中,有兩個(gè)統(tǒng)計(jì)模型被廣泛應(yīng)用于不輕易轉(zhuǎn)變情形下的流失預(yù)測(cè),這兩個(gè)模型分別是邏輯回歸模型和風(fēng)險(xiǎn)模型。即使在多方嘗試型的情形下,公司也可以有效地使用邏輯回歸模型預(yù)測(cè)客戶遷移的上升或下降趨勢(shì),關(guān)于這一點(diǎn),我們將會(huì)在本章的后面作出闡述。
邏輯回歸模型
邏輯回歸模型是回歸預(yù)測(cè)分析模型之一,其中的因變量是一個(gè)二元值,并假定只有兩個(gè)離散值(0或1)。在客戶流失模型中,因變量指的是客戶在某個(gè)特定時(shí)期是否會(huì)流失。也就是說,如果客戶流失,因變量就是1,否則就是0。模型中的自變量通常分為四類:基于成交的特征(或交換特征)、客戶特征、產(chǎn)品特征以及公司的營(yíng)銷工作。應(yīng)用在流失模型中一些關(guān)鍵的交換特征分別是第一次購買后的時(shí)間(持續(xù)時(shí)間)、最后一次購買后的時(shí)間(最后一次購物)、所購產(chǎn)品的種類(購買的全部)、每類產(chǎn)品所購數(shù)量(購物焦點(diǎn))、平均的購買時(shí)間間隔或購買頻率,以及平均收入??蛻籼卣魍ǔS扇丝诮y(tǒng)計(jì)學(xué)中的變量組成,如收入、年齡和受教育程度。重要的產(chǎn)品特征包括產(chǎn)品種類,以及某些產(chǎn)品的當(dāng)前所有權(quán)。市場(chǎng)營(yíng)銷工作在預(yù)測(cè)客戶流失問題方面起著非常重要的作用,它包括營(yíng)銷溝通的數(shù)量以及與客戶溝通的渠道(如電子郵件、電話和面對(duì)面的交流)。
公司使用一段時(shí)期內(nèi)(例如三年)的交易數(shù)據(jù)和營(yíng)銷溝通數(shù)據(jù)來建立模型,而這些抽樣數(shù)據(jù)就是所謂的校準(zhǔn)試樣。公司還會(huì)預(yù)留短期(例如一年)的類似數(shù)據(jù),以測(cè)試這個(gè)使用校準(zhǔn)試樣得出的模型估測(cè)數(shù)據(jù)是否對(duì)其他樣本也適用。這個(gè)樣本被稱為有效樣本。無論是校準(zhǔn)數(shù)據(jù)還是有效數(shù)據(jù),都包含客戶是否已在觀察期內(nèi)流失的信息,而通過這些信息可以得出因變量的值。同時(shí),這些數(shù)據(jù)也含有與交換特征、客戶特征、產(chǎn)品特征、營(yíng)銷溝通(所有自變量)相關(guān)的一些信息,這些信息與每一個(gè)因變量的值是相對(duì)應(yīng)的。此時(shí)便可通過校準(zhǔn)試樣建立邏輯回歸模型,然后就可以估算出參數(shù)值。簡(jiǎn)單來說,邏輯回歸模型確定了一套自變量,而這些自變量有可能影響因變量的值和與每一個(gè)自變量相關(guān)的值(指自變量對(duì)因變量影響程度的參數(shù))。在使用校準(zhǔn)數(shù)據(jù)確定有關(guān)的變量及系數(shù)后,公司便可以為有效數(shù)據(jù)中的所有觀測(cè)預(yù)測(cè)出因變量的值,然后與實(shí)際數(shù)據(jù)進(jìn)行比較。如果模型與有效數(shù)據(jù)相符,公司就可以預(yù)測(cè)今后一段時(shí)期內(nèi)的因變量的值。邏輯回歸模型中估算的所有因變量數(shù)值均在0~1之間,這些估算得出的值被視為客戶流失的概率或流失傾向。
風(fēng)險(xiǎn)模型
風(fēng)險(xiǎn)模型是建立在生存和風(fēng)險(xiǎn)函數(shù)基礎(chǔ)之上的,通常被用來分析失效的時(shí)間(或某一事件發(fā)生的時(shí)間)。雖然風(fēng)險(xiǎn)模型最初是在生物化學(xué)領(lǐng)域發(fā)明的,用來研究一些治療方法對(duì)個(gè)別生命期的影響,但現(xiàn)今它已廣泛應(yīng)用于不同領(lǐng)域,用來研究某些事件發(fā)生的時(shí)間(這些事件有可能是機(jī)器發(fā)生故障,或客戶購物,總之因情形而異)。生存函數(shù)表示個(gè)體生存(不包括該事件的發(fā)生)至某個(gè)特定時(shí)刻(t)的概率。對(duì)購買產(chǎn)品這一事件來說,生存函數(shù)就是客戶不購買產(chǎn)品的概率(在這種情況下,事件是指購買產(chǎn)品)。風(fēng)險(xiǎn)函數(shù)是指假設(shè)該個(gè)體存活至t,在時(shí)刻t瞬時(shí)流失的概率。在客戶流失的情況下,如果假設(shè)客戶在一段時(shí)期后才會(huì)流失,那么他最近時(shí)期從公司流失的概率就是風(fēng)險(xiǎn)概率或風(fēng)險(xiǎn)函數(shù)。風(fēng)險(xiǎn)模型的一個(gè)優(yōu)點(diǎn)是:把沒有發(fā)生的事件作為截尾觀測(cè)數(shù)據(jù)。例如,在用于設(shè)計(jì)模型的樣本中,觀測(cè)期間有20位客戶沒有流失,而其余80人流失了。因?yàn)槟壳斑@20人尚未流失,所以風(fēng)險(xiǎn)模型視這20人的觀測(cè)數(shù)據(jù)為截尾,并且在模型中只包含他們的生存函數(shù)。對(duì)于其余的80人,風(fēng)險(xiǎn)模型中既包含了生存函數(shù),也包含了風(fēng)險(xiǎn)函數(shù),當(dāng)應(yīng)用類似邏輯回歸這樣的模型時(shí),樣本中的20人作為未流失的客戶,而另外80人作為流失的客戶。該種研究方法往往忽略了這樣一個(gè)事實(shí):若將時(shí)間跨度加長(zhǎng),那些所謂的未流失的客戶也可能流失。