




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于馬爾科夫毯網(wǎng)絡(luò)的客戶(hù)流失分析摘 要:貝葉斯網(wǎng)絡(luò)是研究變量之間預(yù)測(cè)才能的有力工具,在解決不確定性和不完好性問(wèn)題以及處理復(fù)雜問(wèn)題上有很大的優(yōu)勢(shì)。作為樸素貝葉斯網(wǎng)絡(luò)的擴(kuò)展,馬爾科夫毯貝葉斯網(wǎng)絡(luò)只根據(jù)對(duì)輸出結(jié)果有顯著影響的輸入變量進(jìn)展分類(lèi)預(yù)測(cè),是一種更為理想的解決方案。利用馬爾科夫毯貝葉斯網(wǎng)絡(luò)進(jìn)展流失客戶(hù)分析,挖掘?qū)е铝魇У目蛻?hù)特征,從而輔助決策者制訂相應(yīng)的客戶(hù)挽留策略。關(guān)鍵詞:貝葉斯網(wǎng)絡(luò);馬爾科夫毯;客戶(hù)流失問(wèn)題中圖分類(lèi)號(hào):TP181貝葉斯網(wǎng)絡(luò)以因果關(guān)系圖的形式,直觀表示了事物之間的因果關(guān)系,并利于進(jìn)展相關(guān)的分類(lèi)預(yù)測(cè),廣泛應(yīng)用于數(shù)據(jù)分析領(lǐng)域。馬爾科夫毯貝葉斯網(wǎng)絡(luò)是其擴(kuò)展,該模型可以進(jìn)步預(yù)測(cè)的準(zhǔn)確
2、性,降低數(shù)據(jù)的過(guò)度擬合,但也增加了計(jì)算的復(fù)雜性,因此需要花費(fèi)更長(zhǎng)的時(shí)間來(lái)構(gòu)造模型。1 貝葉斯網(wǎng)絡(luò)貝葉斯網(wǎng)絡(luò)Bayesian Networks,BN也稱(chēng)貝葉斯信念網(wǎng)絡(luò),20世紀(jì)80年代由Lauritzen和Spiegelhalter提出。貝葉斯網(wǎng)絡(luò)是以貝葉斯理論為根底,貝葉斯網(wǎng)絡(luò)是圖論與概率論結(jié)合的產(chǎn)物,定性并定量地研究變量間關(guān)系。貝葉斯網(wǎng)絡(luò)應(yīng)用于分類(lèi)、特征提取和推理等方面,是機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域的重要工具,在故障診斷、風(fēng)險(xiǎn)評(píng)估和生物信息等方面有著廣泛的應(yīng)用。1.1 貝葉斯網(wǎng)絡(luò)的組成。2 馬爾科夫毯網(wǎng)絡(luò)2.1 馬爾科夫毯網(wǎng)絡(luò)的根本概念馬爾科夫毯變量是馬爾科夫毯網(wǎng)絡(luò)中的一個(gè)根本概念,是指對(duì)于節(jié)點(diǎn)
3、Xi來(lái)說(shuō),其父節(jié)點(diǎn)、子節(jié)點(diǎn)以及子節(jié)點(diǎn)的父節(jié)點(diǎn),都屬于節(jié)點(diǎn)X1的馬爾科夫毯變量。以樸素貝葉斯網(wǎng)絡(luò)為例,由于輸入變量節(jié)點(diǎn)均為輸出變量節(jié)點(diǎn)的子節(jié)點(diǎn),所以輸出變量的馬爾科夫毯變量是所有輸入變量。對(duì)于馬爾科夫毯網(wǎng)絡(luò)來(lái)說(shuō),輸入變量的馬爾科夫毯變量應(yīng)是與輸出變量顯著相關(guān)的輸入變量。于是,分類(lèi)預(yù)測(cè)將基于輸出變量的馬爾科夫毯變量的結(jié)合概率,而非全體輸入變量。構(gòu)建馬爾科夫毯網(wǎng)絡(luò)的主要任務(wù)是估計(jì)參數(shù)集合以及確定網(wǎng)絡(luò)構(gòu)造S。2.2 馬爾科夫毯網(wǎng)絡(luò)構(gòu)造的參數(shù)估計(jì)通常采用貝葉斯方法進(jìn)展估計(jì),涉及參數(shù)的先驗(yàn)概率、似然函數(shù),以及參數(shù)的后驗(yàn)概率三個(gè)方面。先驗(yàn)分布與后驗(yàn)分布是共軛分布,同屬一分布族1 。假設(shè)馬爾科夫毯網(wǎng)絡(luò)中的每個(gè)
4、節(jié)點(diǎn)對(duì)應(yīng)的變量均為二分類(lèi)變量,參數(shù)的先驗(yàn)分布可選用Beta分布。標(biāo)準(zhǔn)Beta分布的數(shù)學(xué)定義為:式中,為Gamma函數(shù),x=x-1!,1=1;取值在01之間。Bata分布中的參數(shù)和成為超參數(shù)。參數(shù)的后驗(yàn)分布也服從Beta分布:式中,n為“成功的次數(shù);N為實(shí)驗(yàn)的次數(shù)?;谶@個(gè)后驗(yàn)分布,參數(shù)的期望為: ,即為最終參數(shù)估計(jì)值。假設(shè)馬爾科夫毯網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)的變量為具有r個(gè)類(lèi)別的多分類(lèi)型變量,參數(shù)的先驗(yàn)分布可選用Dirichlet分布。Dirichlet分布的數(shù)學(xué)定義為:。2.3 馬爾科夫毯網(wǎng)絡(luò)構(gòu)造的學(xué)習(xí)確定馬爾科夫毯網(wǎng)絡(luò)構(gòu)造S的核心是尋找各個(gè)變量的馬爾科夫毯變量。對(duì)于節(jié)點(diǎn)Xi,不在馬爾科夫毯變量范
5、圍內(nèi)的變量,是與變量Xi條件獨(dú)立的變量。所以,構(gòu)建馬爾科夫毯網(wǎng)絡(luò)構(gòu)造S的首要任務(wù)是確定獨(dú)立變量對(duì),它們均不在彼此的馬爾科夫毯變量中。馬爾科夫毯網(wǎng)絡(luò)利用條件獨(dú)立檢驗(yàn)方法,發(fā)現(xiàn)變量之間的條件獨(dú)立關(guān)系,并以此為根底構(gòu)建馬爾科夫毯網(wǎng)絡(luò)。常用的方法有:條件卡方Pearson Chi-square檢驗(yàn)和條件對(duì)數(shù)似然率Log Likelihood Ratio檢驗(yàn)等。設(shè)IXi, Xj為變量Xi和Xj獨(dú)立檢驗(yàn)的概率P-值,IXi, Xj,S為給定變量S條件下,變量對(duì)Xi和Xj條件獨(dú)立檢驗(yàn)的概率P-值。馬爾科夫毯網(wǎng)絡(luò)構(gòu)造學(xué)習(xí)的根本步驟如下:第一,起始的網(wǎng)絡(luò)構(gòu)造S是一個(gè)完全連接的無(wú)向網(wǎng)絡(luò)。第二,假設(shè)IXi,Xj大于
6、指定的顯著程度,那么刪除節(jié)點(diǎn)Xi和節(jié)點(diǎn)Xj間的連接弧線(xiàn)。第三,對(duì)每個(gè)節(jié)點(diǎn)Xi,在其剩余弧線(xiàn)中,尋找是否存在IXi,Xj,S大于顯著性程度。假設(shè)存在,那么刪除節(jié)點(diǎn)Xi和節(jié)點(diǎn)Xj間的連接弧線(xiàn)。第四,將無(wú)向弧線(xiàn)轉(zhuǎn)換為有向弧線(xiàn)。2.4 馬爾科夫毯網(wǎng)絡(luò)的分類(lèi)預(yù)測(cè)根據(jù)貝葉斯公式,對(duì)于新觀測(cè)Xp,輸出變量Y有k個(gè)可能的類(lèi)別取值,輸出變量取Yj的概率為:式中, 即為輸出變量及馬爾科夫毯變量的結(jié)合概率。其中C為常量,它將與分母中的C約掉,并不影響預(yù)測(cè)結(jié)果。這里引入常數(shù)C的目的是,表示并非輸入變量集合中所有變量都參與計(jì)算,參與計(jì)算的僅是馬爾科夫毯變量。3 案例分析本文數(shù)據(jù)選取自某公司的電信客戶(hù)數(shù)據(jù),選取了463條
7、客戶(hù)信息,每條數(shù)據(jù)包括年齡、性別、收入、開(kāi)通月數(shù)、教育程度等字段;并利用通用數(shù)據(jù)挖掘軟件Clementine12.0,目的在于研究對(duì)流失客戶(hù)有重要影響的因素,并計(jì)算出預(yù)測(cè)模型,以此指導(dǎo)銷(xiāo)售。圖1顯示,客戶(hù)流失的馬爾科夫毯變量包括開(kāi)通月數(shù)、收入和年齡,其中最顯著影響因素為開(kāi)通月數(shù),重要性超過(guò)0.8。預(yù)測(cè)一個(gè)新客戶(hù)是否流失時(shí),僅需計(jì)算流失與其馬爾科夫毯變量的結(jié)合概率即可。電信公司可以靈敏應(yīng)對(duì)各種不同的人群設(shè)計(jì)不同的效勞工程,最大限度地進(jìn)步市場(chǎng)占有率,防止客戶(hù)流失,進(jìn)步客戶(hù)的忠誠(chéng)度;同時(shí)分析結(jié)果也為公司提供了大量的數(shù)據(jù)信息和潛在規(guī)律,從而使公司獲得充分的市場(chǎng)信息,以獲得最大收益。圖1 客戶(hù)流失問(wèn)題的馬爾科夫毯網(wǎng)絡(luò)4 完畢語(yǔ)隨著互聯(lián)網(wǎng)的開(kāi)展,電子商務(wù)已經(jīng)成為了商業(yè)運(yùn)作的重要形式。數(shù)據(jù)挖掘技術(shù)有助于企業(yè)從數(shù)據(jù)庫(kù)以及數(shù)據(jù)倉(cāng)庫(kù)中更快和更準(zhǔn)確地尋找到所需要的信息內(nèi)容,貝葉斯網(wǎng)絡(luò)是數(shù)據(jù)挖掘領(lǐng)域的重要算法。樸素貝葉斯網(wǎng)絡(luò)構(gòu)造簡(jiǎn)單,不涉及網(wǎng)絡(luò)構(gòu)造的學(xué)習(xí)。馬爾科夫毯網(wǎng)絡(luò)更多考慮了輸入變量之間的條件獨(dú)立性,因此更利于找到輸出變量有重要影響的因素;它在電子商務(wù)中的應(yīng)用,有助于分析客戶(hù)流失規(guī)律,幫助企業(yè)及時(shí)制定營(yíng)銷(xiāo)策略,維持客戶(hù)忠誠(chéng)度。參考文獻(xiàn):2朱志勇,徐長(zhǎng)梅,劉志兵,胡晨剛.基于貝葉斯網(wǎng)絡(luò)的客戶(hù)流失分
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 一元二次函數(shù)、方程和不等式 基礎(chǔ)測(cè)試(含解析)-2026屆高三數(shù)學(xué)一輪復(fù)習(xí)
- 原電池新型電源(練)-2023年高考化學(xué)一輪復(fù)習(xí)(新教材新高考)
- 4項(xiàng)目四 自動(dòng)售檢票系統(tǒng)終端設(shè)備
- 四川省德陽(yáng)市綿竹中學(xué)2024-2025學(xué)年高二上學(xué)期開(kāi)學(xué)考試地理試卷(含答案)
- 合同談判策略及技巧培訓(xùn)資料
- 移動(dòng)醫(yī)療應(yīng)用程序開(kāi)發(fā)安全標(biāo)準(zhǔn)
- 2024-2025學(xué)年江蘇省無(wú)錫第六高級(jí)中學(xué)高二(下)期中數(shù)學(xué)試卷(含答案)
- 2025秋初中數(shù)學(xué)九年級(jí)上冊(cè)人教版教案設(shè)計(jì) 22.1.2二次函數(shù)y=ax2的圖象和性質(zhì)(2)-1教案
- 山東省濱州市鄒平市2024-2025學(xué)年八年級(jí)上學(xué)期期末考試物理試題【含答案】
- 三角函數(shù)的概念與誘導(dǎo)公式(復(fù)習(xí)講義)-2026年高考數(shù)學(xué)一輪復(fù)習(xí)原卷版
- 普外科醫(yī)療質(zhì)量評(píng)價(jià)體系與考核標(biāo)準(zhǔn)
- IWE(國(guó)際焊接工程師)考試試題生產(chǎn)模塊
- 40M躉船總體建造方案
- 吞咽障礙患者的營(yíng)養(yǎng)支持課件
- 行政處罰案卷制作規(guī)范課件
- 無(wú)人機(jī)操控快速入門(mén)訓(xùn)練法
- 中國(guó)醫(yī)院質(zhì)量安全管理 第4-13部分:醫(yī)療管理住院患者健康教育 T∕CHAS 10-4-13-2020
- 化學(xué)工業(yè)計(jì)量器具分級(jí)管理辦法解釋
- 火電廠(chǎng)熱控施工方案
- 高中物理(人教版)必修1全冊(cè)課件
- 完整版_第八版內(nèi)科冠心病課件
評(píng)論
0/150
提交評(píng)論