客戶1和客戶2 均與不止一家公司進行交易,但是他們的購買份額并沒有平均分配給與其有交易的各家公司。在這種情況下,我們不會知道他們具體的流失時間,許多消費品的采購都屬于這種類型。在這種方式中,被用來建模的并不是客戶流失的時間,而是與每家公司或每種品牌相關(guān)的客戶轉(zhuǎn)移概率。遷移模型和馬爾科夫(Markov)模型通常都是用來估算客戶轉(zhuǎn)移概率的模型。
廣泛應(yīng)用的流失模型
在上述不輕易轉(zhuǎn)變型的方式中,模型預(yù)測了客戶流失的概率。在眾多能夠預(yù)測客戶流失概率的模型當中,有兩個統(tǒng)計模型被廣泛應(yīng)用于不輕易轉(zhuǎn)變情形下的流失預(yù)測,這兩個模型分別是邏輯回歸模型和風險模型。即使在多方嘗試型的情形下,公司也可以有效地使用邏輯回歸模型預(yù)測客戶遷移的上升或下降趨勢,關(guān)于這一點,我們將會在本章的后面作出闡述。
邏輯回歸模型
邏輯回歸模型是回歸預(yù)測分析模型之一,其中的因變量是一個二元值,并假定只有兩個離散值(0或1)。在客戶流失模型中,因變量指的是客戶在某個特定時期是否會流失。也就是說,如果客戶流失,因變量就是1,否則就是0。模型中的自變量通常分為四類:基于成交的特征(或交換特征)、客戶特征、產(chǎn)品特征以及公司的營銷工作。應(yīng)用在流失模型中一些關(guān)鍵的交換特征分別是第一次購買后的時間(持續(xù)時間)、最后一次購買后的時間(最后一次購物)、所購產(chǎn)品的種類(購買的全部)、每類產(chǎn)品所購數(shù)量(購物焦點)、平均的購買時間間隔或購買頻率,以及平均收入??蛻籼卣魍ǔS扇丝诮y(tǒng)計學中的變量組成,如收入、年齡和受教育程度。重要的產(chǎn)品特征包括產(chǎn)品種類,以及某些產(chǎn)品的當前所有權(quán)。市場營銷工作在預(yù)測客戶流失問題方面起著非常重要的作用,它包括營銷溝通的數(shù)量以及與客戶溝通的渠道(如電子郵件、電話和面對面的交流)。
公司使用一段時期內(nèi)(例如三年)的交易數(shù)據(jù)和營銷溝通數(shù)據(jù)來建立模型,而這些抽樣數(shù)據(jù)就是所謂的校準試樣。公司還會預(yù)留短期(例如一年)的類似數(shù)據(jù),以測試這個使用校準試樣得出的模型估測數(shù)據(jù)是否對其他樣本也適用。這個樣本被稱為有效樣本。無論是校準數(shù)據(jù)還是有效數(shù)據(jù),都包含客戶是否已在觀察期內(nèi)流失的信息,而通過這些信息可以得出因變量的值。同時,這些數(shù)據(jù)也含有與交換特征、客戶特征、產(chǎn)品特征、營銷溝通(所有自變量)相關(guān)的一些信息,這些信息與每一個因變量的值是相對應(yīng)的。此時便可通過校準試樣建立邏輯回歸模型,然后就可以估算出參數(shù)值。簡單來說,邏輯回歸模型確定了一套自變量,而這些自變量有可能影響因變量的值和與每一個自變量相關(guān)的值(指自變量對因變量影響程度的參數(shù))。在使用校準數(shù)據(jù)確定有關(guān)的變量及系數(shù)后,公司便可以為有效數(shù)據(jù)中的所有觀測預(yù)測出因變量的值,然后與實際數(shù)據(jù)進行比較。如果模型與有效數(shù)據(jù)相符,公司就可以預(yù)測今后一段時期內(nèi)的因變量的值。邏輯回歸模型中估算的所有因變量數(shù)值均在0~1之間,這些估算得出的值被視為客戶流失的概率或流失傾向。
風險模型
風險模型是建立在生存和風險函數(shù)基礎(chǔ)之上的,通常被用來分析失效的時間(或某一事件發(fā)生的時間)。雖然風險模型最初是在生物化學領(lǐng)域發(fā)明的,用來研究一些治療方法對個別生命期的影響,但現(xiàn)今它已廣泛應(yīng)用于不同領(lǐng)域,用來研究某些事件發(fā)生的時間(這些事件有可能是機器發(fā)生故障,或客戶購物,總之因情形而異)。生存函數(shù)表示個體生存(不包括該事件的發(fā)生)至某個特定時刻(t)的概率。對購買產(chǎn)品這一事件來說,生存函數(shù)就是客戶不購買產(chǎn)品的概率(在這種情況下,事件是指購買產(chǎn)品)。風險函數(shù)是指假設(shè)該個體存活至t,在時刻t瞬時流失的概率。在客戶流失的情況下,如果假設(shè)客戶在一段時期后才會流失,那么他最近時期從公司流失的概率就是風險概率或風險函數(shù)。風險模型的一個優(yōu)點是:把沒有發(fā)生的事件作為截尾觀測數(shù)據(jù)。例如,在用于設(shè)計模型的樣本中,觀測期間有20位客戶沒有流失,而其余80人流失了。因為目前這20人尚未流失,所以風險模型視這20人的觀測數(shù)據(jù)為截尾,并且在模型中只包含他們的生存函數(shù)。對于其余的80人,風險模型中既包含了生存函數(shù),也包含了風險函數(shù),當應(yīng)用類似邏輯回歸這樣的模型時,樣本中的20人作為未流失的客戶,而另外80人作為流失的客戶。該種研究方法往往忽略了這樣一個事實:若將時間跨度加長,那些所謂的未流失的客戶也可能流失。