基于通信數(shù)據(jù)的移動用戶行為分析_第1頁
基于通信數(shù)據(jù)的移動用戶行為分析_第2頁
基于通信數(shù)據(jù)的移動用戶行為分析_第3頁
基于通信數(shù)據(jù)的移動用戶行為分析_第4頁
基于通信數(shù)據(jù)的移動用戶行為分析_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

基于通信數(shù)據(jù)的移動顧客行為分析基于通信數(shù)據(jù)的移動顧客行為分析[摘要]認(rèn)為分析移動顧客行為特性與分類,對移動應(yīng)用個性化服務(wù)的改善含有重要的參考價(jià)值。基于國內(nèi)電信運(yùn)行商隨機(jī)抽取某市一萬移動顧客一周的日志統(tǒng)計(jì),其中含有4萬余條通話統(tǒng)計(jì)和200余萬條網(wǎng)絡(luò)請求,每條請求包含對應(yīng)的基站標(biāo)號以及基站地理位置。本研究從消費(fèi)能力、通話量、網(wǎng)絡(luò)請求量、位移量四個維度從這批數(shù)據(jù)中提取14種基本特性指標(biāo)。運(yùn)用K-Means聚類辦法將移動顧客分辨成規(guī)律通話型、隨機(jī)上網(wǎng)型、居家節(jié)省型和隨機(jī)高消費(fèi)型等四類顧客模型。[核心詞]顧客行為分析;移動顧客研究;聚類分析;數(shù)據(jù)挖掘[分類號]G351引言隨著移動通信技術(shù)的迅猛發(fā)展和廣泛應(yīng)用,移動終端大量普及于民眾,也產(chǎn)生了大量顧客信息統(tǒng)計(jì),如何運(yùn)用大數(shù)據(jù)來理解移動顧客行為與習(xí)慣特性的研究不停涌現(xiàn)。通過對移動顧客的分析與理解,許多公司與政府部門能夠根據(jù)成果提供各式各樣的服務(wù)與應(yīng)用方案。移動顧客行為分析普通是指基于地理信息涉及顧客訪問網(wǎng)絡(luò)、通話的行為規(guī)律與活動研究。電信運(yùn)行商通過獲取顧客訪問移動互聯(lián)網(wǎng)、使用移動應(yīng)用及通話的行為規(guī)律,能夠有效地配備網(wǎng)絡(luò)資源并提供含有針對性的服務(wù)。近年來,針對桌面端日志挖掘的研究層出不窮,[15,16,17]都是針對桌面端web服務(wù)的后臺日志挖掘入手,通過分析顧客訪問頁面的占比、顧客訪問的頁面次序等對顧客的行為進(jìn)行建模。而針對移動顧客的行為分析研究則在諸多方面借鑒了桌面端的研究,同時(shí)運(yùn)用移動端設(shè)備的地理位置位置統(tǒng)計(jì),挖掘出顧客移動軌跡模式,找出軌跡中重要的位置并結(jié)合通信數(shù)據(jù)、互聯(lián)網(wǎng)日志數(shù)據(jù)以及移動應(yīng)用數(shù)據(jù)作為研究的基礎(chǔ),分析挖掘移動顧客的需求、行為、愛好,甚至是通過預(yù)測顧客的目的地、推測顧客下一步即將達(dá)成的位置方便提供針對性的推薦服務(wù)[1,13]。傳統(tǒng)的移動顧客軌跡分析,多數(shù)運(yùn)用軟件采集仿真數(shù)據(jù),屬于細(xì)時(shí)空粒度下的數(shù)據(jù),即能夠采集到顧客一天中持續(xù)時(shí)間段的位置數(shù)據(jù)。Y.Zhu等作者著眼于顧客位置數(shù)據(jù)中經(jīng)常出現(xiàn)的地點(diǎn),并根據(jù)出現(xiàn)時(shí)間來推測顧客所處的位置是家還是公司[2]。另外,S.Akoush和A.Sameh則通過指定時(shí)間粒度,聚類顧客在多日同一時(shí)間段的行動軌跡,運(yùn)用稀疏數(shù)據(jù)擬合出顧客在這時(shí)間段移動軌跡的目的[3]。研究顧客的移動軌跡,實(shí)現(xiàn)預(yù)測顧客下一步位置目的的辦法,涉及運(yùn)用貝葉斯算法、聚類、數(shù)據(jù)挖掘辦法等。事實(shí)上,電信運(yùn)行商服務(wù)器上的數(shù)據(jù)是粗時(shí)間粒度的,唯有請求通信或上網(wǎng)時(shí)才會被統(tǒng)計(jì),因此顧客位置變化是不連貫的,含有隨機(jī)性、稀疏性的特點(diǎn),不能支持顧客行為軌跡直接且持續(xù)的刻畫描述。譚均元等人提出了生活熵概念作為顧客移動軌跡規(guī)律程度的度量[4],采用了個人多天時(shí)段移動序列的算法來彌補(bǔ)實(shí)際數(shù)據(jù)的這種局限性,即通過對多天數(shù)據(jù)的分析來獲得更精確的顧客移動軌跡。S.A.Shad則結(jié)合地理信息與顧客提供的上下文語義信息來增加預(yù)測精確性[5]。梁鵬等作者則透過在WAP網(wǎng)關(guān)進(jìn)行數(shù)據(jù)采集,并對數(shù)據(jù)進(jìn)行數(shù)值分析和擬合,最后得到顧客行為的統(tǒng)計(jì)性特性來建立顧客行為分析模型[6]。呂洋運(yùn)用上網(wǎng)數(shù)據(jù)研究顧客的網(wǎng)絡(luò)請求行為、時(shí)間、網(wǎng)頁應(yīng)用、數(shù)據(jù)包大小等信息建立顧客行為模型[7]。Y.Liu關(guān)注于移動顧客上網(wǎng)過程中訪問頻率、訪問時(shí)間、訪問深度之間的關(guān)系[8]。G.F.Zhao等作者則運(yùn)用二分網(wǎng)絡(luò)模型來分析移動顧客上網(wǎng)過程中顧客與不同網(wǎng)站之間的關(guān)聯(lián)。對移動顧客上網(wǎng)請求過程中數(shù)據(jù)包的大小、請求響應(yīng)時(shí)間等的研究也是與運(yùn)行商有關(guān)的研究方向[9,10,11,12]。由此可知,國內(nèi)外對移動顧客行為的研究呈現(xiàn)向上的趨勢,研究的辦法也越來越多樣。筆者基于運(yùn)行商提供的移動數(shù)據(jù),提取顧客特性,并將選用的特性作為聚類分析的輸入?yún)?shù),以發(fā)現(xiàn)含有不同行為特性的顧客類別。運(yùn)用消費(fèi)能力、通話量、網(wǎng)絡(luò)請求量、位移量四個維度作為分析顧客行為的基礎(chǔ),從該批數(shù)據(jù)中提取有關(guān)的評價(jià)指標(biāo)。通過聚類算法對顧客的分類,分析各類型顧客所獨(dú)有的屬性、行為特性。各類顧客模型分析成果能夠作為電信運(yùn)行商、服務(wù)或應(yīng)用提供公司根據(jù)不同顧客類型提供更加好的推薦服務(wù)。2數(shù)據(jù)集及預(yù)解決2.1數(shù)據(jù)集本研究的數(shù)據(jù)集來自國內(nèi)移動電信運(yùn)行商某市內(nèi)的一萬注冊顧客的一周數(shù)據(jù),時(shí)間為12月的第一周。數(shù)據(jù)涉及顧客基本信息、通話統(tǒng)計(jì)、上網(wǎng)統(tǒng)計(jì)、以及使用基站地理位置等,其中共有456006條通話統(tǒng)計(jì)和21441422條網(wǎng)絡(luò)請求統(tǒng)計(jì)。該批數(shù)據(jù)中的所使用到的具體的信息字段涉及:顧客編號(user_id)、移動產(chǎn)品品牌(brand_name)、顧客通話產(chǎn)生的費(fèi)用(call_fee)、顧客上網(wǎng)產(chǎn)生的流量費(fèi)用(gprs_fee)、增值業(yè)務(wù)費(fèi)(databusiness_fee)、終端品牌(brand_chn)、手機(jī)操作系統(tǒng)(operation_sys)、通話開始時(shí)間(start_time)、通話結(jié)束時(shí)間(end_time)、通話基站緯度(longitude)、通話基站經(jīng)度(latitude)、網(wǎng)絡(luò)請求時(shí)間(start_time)、網(wǎng)絡(luò)請求基站緯度(longitude)、網(wǎng)絡(luò)請求基站經(jīng)度(latitude)等??紤]到商業(yè)機(jī)密和隱私保護(hù),筆者只對部份信息進(jìn)行分析和成果展示。2.2數(shù)據(jù)預(yù)解決 數(shù)據(jù)預(yù)解決的重要工作包含刪除空統(tǒng)計(jì);刪除通話數(shù)據(jù)異常統(tǒng)計(jì)(單一通話持續(xù)時(shí)長超出十小時(shí));去除與標(biāo)記部份字段值缺失統(tǒng)計(jì);以及清理顧客請求基站服務(wù)的異常統(tǒng)計(jì)。通過數(shù)據(jù)清理與預(yù)解決,最后共8916個有效顧客。(1)部份字段值缺失統(tǒng)計(jì)該批數(shù)據(jù)顧客的基本信息統(tǒng)計(jì)中,對于顧客通話產(chǎn)生的費(fèi)用、顧客上網(wǎng)產(chǎn)生的流量費(fèi)用、增值業(yè)務(wù)費(fèi)數(shù)據(jù)缺失的狀況,這是由于顧客在對應(yīng)字段意義內(nèi)未產(chǎn)生額外費(fèi)用,統(tǒng)一賦值為0;對于手機(jī)品牌或操作系統(tǒng)值缺失的狀況,我們推測這是由于顧客是用的手機(jī)并不屬于主流品牌或主流操作系統(tǒng),統(tǒng)一賦值為其它(OTHER);顧客的通話與上網(wǎng)數(shù)據(jù)統(tǒng)計(jì)有開始時(shí)間或結(jié)束時(shí)間缺失,對這部分統(tǒng)計(jì)做了刪除解決;并且顧客通話和上網(wǎng)數(shù)據(jù)中的位置信息的經(jīng)緯度缺失的狀況,也做了去除解決。(2)顧客請求基站服務(wù)的異常統(tǒng)計(jì)根據(jù)同一顧客不同時(shí)間的持續(xù)位移數(shù)據(jù)分析,發(fā)現(xiàn)部份統(tǒng)計(jì)顧客在極短時(shí)間內(nèi)進(jìn)行了極大的位移。本研究運(yùn)用通話起始、結(jié)束時(shí)間、上網(wǎng)請求時(shí)間、基站緯度、基站經(jīng)度來計(jì)算顧客位移時(shí)速,將時(shí)速不不大于100km/h的顧客統(tǒng)計(jì)去除。在數(shù)據(jù)的解決過程中,通過Python這種簡樸易用的編程語言結(jié)合其用于數(shù)據(jù)分析解決的類庫Numpy、Pandas[14]等大大減少了的我們的工作難度。3特性選用本研究通過特性選用與統(tǒng)計(jì)成果來挖掘移動顧客的特性,并運(yùn)用這特性作為聚類的參數(shù),將移動顧客行為分類。本研究運(yùn)用消費(fèi)能力、通話量、網(wǎng)絡(luò)請求量、位移量四個維度作為分析顧客行為的基礎(chǔ)。根據(jù)這四個維度的特性從該批數(shù)據(jù)中提取有關(guān)的評價(jià)指標(biāo),分別包含。消費(fèi)能力:通過客戶品牌、系統(tǒng)、話費(fèi)三種來綜合顧客的消費(fèi)階層;通話量:運(yùn)用每日通話次數(shù)、通話時(shí)長、每次通話時(shí)長、以及各時(shí)間段通話時(shí)長分布等作為顧客通話習(xí)慣的評價(jià)指標(biāo);網(wǎng)絡(luò)請求量:運(yùn)用網(wǎng)絡(luò)請求次數(shù)、各時(shí)間段的網(wǎng)絡(luò)請求分布等統(tǒng)計(jì)成果作為描述顧客上網(wǎng)習(xí)慣的特性參數(shù);位移量:使用每日出現(xiàn)的基站數(shù)、位置位移量與生活熵的統(tǒng)計(jì)和計(jì)算成果來描述顧客一天中位置變化參數(shù)。3.1消費(fèi)能力本研究通過客戶品牌、手機(jī)系統(tǒng)、話費(fèi)三種特性來綜合評價(jià),評量顧客的消費(fèi)階層。該批數(shù)據(jù)的電信運(yùn)行商提供重要三個客戶品牌:動感地帶、全球通和神州行,動感地帶是面對年輕群體的客戶品牌,目的顧客是每月月話費(fèi)值低,可是數(shù)據(jù)業(yè)務(wù)比重高的顧客。全球通則面對中高端顧客,較早地推出國際漫游和手機(jī)銀行等加值服務(wù)。神州行則是面對大眾顧客,客戶群的職業(yè)、年紀(jì)等跨度都較大,資費(fèi)重視實(shí)惠、大眾化。由此可知,客戶品牌作為顧客個人消費(fèi)能力的一種特性。該批數(shù)據(jù)中,屬于“動感地帶”客戶品牌的顧客占全部的66%,使用“全球通”的顧客占全部的13%,而“神州行”的顧客占全部的21%。因此,重要手機(jī)移動顧客以年輕顧客為居多,并數(shù)據(jù)業(yè)務(wù)比重高的需求大。由于每個顧客移動裝置的具體消費(fèi)型號無法獲得,本研究通過該顧客手機(jī)的品牌與操作系統(tǒng)作為該顧客的手機(jī)消費(fèi)喜好參考特性之一,根據(jù)顧客使用的系統(tǒng)與品牌重要分成安卓(Android)、蘋果(iOS)、微軟(Windows)、黑莓(Blackberry)以及其它(Other)。由于安卓系統(tǒng)占很大比例,并且該系統(tǒng)的手機(jī)消費(fèi)分布廣泛,因此在切分成三星(Samsung)、小米/魅族,以及其它安卓(OthersofAndroid)。小米手機(jī)和魅族在價(jià)位及使用的顧客群方面類似,因此本研究將其歸為一類。盡管黑莓系統(tǒng)手機(jī)數(shù)量極少,但較多專業(yè)人員使用,本研究仍單獨(dú)劃為一類。經(jīng)統(tǒng)計(jì)使用系統(tǒng)的顧客比例分別為:蘋果,22.02%。微軟,2.32%。黑莓,0.25%。三星,19.39%。小米/魅族,7.92%。其它安卓,20.12%。其它系統(tǒng),27.93%。由此可知,多數(shù)顧客仍選用安卓與蘋果系統(tǒng)的手機(jī)。顧客在使用移動服務(wù)的過程中,消費(fèi)重要分為三類:通話費(fèi)、流量費(fèi)和增值業(yè)務(wù)費(fèi)。本研究將這三種消費(fèi)的總和作為移動顧客的消費(fèi)金額。統(tǒng)計(jì)發(fā)現(xiàn),顧客月話費(fèi)額的均值為51.01元,中位數(shù)為33.20元,并且半數(shù)的顧客話費(fèi)介于12.77至66.52元之間。3.2通話量運(yùn)用平均每日通話次數(shù)、平均通話時(shí)長、每次平均通話時(shí)長、以及各時(shí)間段通話時(shí)長分布等分析出顧客通話習(xí)慣的評價(jià)指標(biāo)。將計(jì)算出顧客多天的通話總次數(shù),再除以天數(shù)作為平均每日通話次數(shù)的計(jì)算方式。根據(jù)計(jì)算成果,顧客平均每天的通話次數(shù)為7.19次。通話最少的顧客,7天內(nèi)只通話一次。最多的顧客則平均每天通話89.43次。75%的顧客平均每天的通話次數(shù)在9.14次上下。相似的,平均每日通話時(shí)長是指顧客一周的通話總時(shí)長,除以天數(shù)的計(jì)算成果。該批數(shù)據(jù)的每日通話時(shí)長統(tǒng)計(jì)分布如圖1所示。全部顧客平均每日通話時(shí)長為2440.49s,四分位數(shù)分別為724.25s、1481.93s和2854.96s,可見大多數(shù)顧客每天的通話時(shí)間都比較短,少數(shù)顧客的大量通話行為對平均數(shù)影響比較大。并且,計(jì)算顧客多天的通話總時(shí)長除以通話總次數(shù)作為每次平均通話時(shí)長。經(jīng)統(tǒng)計(jì)成果得到顧客的平均每次通話時(shí)長為335.65s,四分位分別是204.59s、253.18s、352.00s。每次通話時(shí)長最短只有46s,最長的則有3022s.圖1平均每日通話時(shí)長分布為了分析移動顧客的通話時(shí)長分布,本研究將一天分為8個時(shí)間段,從0點(diǎn)開始,每3個小時(shí)作為一種時(shí)間段。這劃分方式將故意義的區(qū)別出顧客休息時(shí)間、就餐時(shí)間、工作時(shí)間及上下班時(shí)間等。這8個時(shí)段的通話統(tǒng)計(jì)成果如圖2所示,為了優(yōu)化展示,圖2顯示隨機(jī)抽取十分之一的顧客通話數(shù)據(jù),縱軸與橫軸分別代表平均通話時(shí)長與個別顧客。通過統(tǒng)計(jì)成果,75%的顧客的通話行為模式是早上6點(diǎn)后來開始使用手機(jī),在兩個時(shí)段“9點(diǎn)至12點(diǎn)”及“15點(diǎn)至18點(diǎn)”處在通話高峰,在18點(diǎn)至21點(diǎn)之間仍有相稱高的通話量,晚上9點(diǎn)后則通話趨緩。圖2一天8個時(shí)段的通話時(shí)長分布(圖中橫線為各時(shí)段的四分位線)運(yùn)用這時(shí)段的切割具體分析每位移動顧客的通話行為,將個得到該顧客隱性的特性。舉例來說,以“21:00-24:00”時(shí)段中,將通話時(shí)長最長的顧客一天的通話數(shù)據(jù)作展示分析,如圖3所示。該顧客一天內(nèi)平均通話時(shí)長比較80%的顧客高,早上6點(diǎn)前,該顧客處在不通話的狀態(tài),隨即的時(shí)間段通話量即高出90%的顧客,而在背面5個時(shí)間段里皆是通話時(shí)長最高的顧客。由此可知,該顧客是生活規(guī)律型上班族,并且全天都有大量通話行為,推測該顧客的工作業(yè)務(wù)與通話的有關(guān)度較高,同時(shí)在下班時(shí)段也有諸多公務(wù)及私人通話的需求。綜合以上的統(tǒng)計(jì),不同顧客間的通話習(xí)慣差別很大,本研究運(yùn)用這8個時(shí)段的平均通話時(shí)長作為分析參數(shù)之一。圖3某顧客一天的通話時(shí)長折線圖3.3網(wǎng)絡(luò)請求量與通話量的特性選用辦法同樣,運(yùn)用平均網(wǎng)絡(luò)請求次數(shù)、各時(shí)間段的網(wǎng)絡(luò)請求分布作為描述顧客上網(wǎng)習(xí)慣的特性,將一周上網(wǎng)請求次數(shù)總和除以天數(shù)作為平均每天網(wǎng)絡(luò)請求次數(shù)。經(jīng)統(tǒng)計(jì)的成果,顧客每天的平均網(wǎng)絡(luò)請求次數(shù)為313.39次,并且四分之三的顧客平均每日網(wǎng)絡(luò)請求次數(shù)維持在382.14次下列。請求最多的顧客高達(dá)成13845次。本研究仍然運(yùn)用8個時(shí)間段作為顧客一天上網(wǎng)請求行為的分析。80%的顧客的移動上網(wǎng)請求多數(shù)是在早上6點(diǎn)后來,且在“9點(diǎn)至12點(diǎn)”、“12點(diǎn)至15點(diǎn)”及“15點(diǎn)至18點(diǎn)”三個時(shí)段處在上網(wǎng)高峰,18點(diǎn)后來漸漸趨緩。闡明多數(shù)人運(yùn)用白天或上班時(shí)間移動上網(wǎng),晚上則改成其它方式使用網(wǎng)絡(luò)或從事其它活動。3.4位移量(1)基站與位移量的計(jì)算由于該批數(shù)據(jù)的限制,缺少顧客每個時(shí)刻的基站位置,只含有通話及上網(wǎng)請求時(shí)的基站位置統(tǒng)計(jì),因此,本研究運(yùn)用通話及上網(wǎng)請求行為中所使用的基站數(shù)、各時(shí)段使用的基站數(shù)和位移量這三個特性來描述顧客一天的運(yùn)動狀況。該批數(shù)據(jù)中,多數(shù)顧客一天的平均通信基站數(shù)比較少,只有3.68個,而75%的顧客每天使用基站數(shù)在5個下列,盡管有個別顧客一天的通信行為中出現(xiàn)的基站數(shù)在20個以上。同時(shí),統(tǒng)計(jì)不同時(shí)間段的平均基站數(shù)后,以持續(xù)5個時(shí)間段”6點(diǎn)至21點(diǎn)”中,每時(shí)間段內(nèi)出現(xiàn)的基站數(shù)超出2個即鑒定為全天都有移動行為的顧客占55.44%。本研究運(yùn)用獲得的基站位置粗略體現(xiàn)為顧客運(yùn)動的距離,假設(shè)顧客在一天中第一次發(fā)起請求所在基站為A,隨即發(fā)起請求的基站分別為B、C、D、以及最后的基站E,則該顧客一天的總移動距離SdaySday=SAB+通過這各距離運(yùn)算公式,統(tǒng)計(jì)出全部顧客每日平均移動距離為31.62公里,有68.67%的顧客移動距離低于平均值。(2)生活熵除了上述的各項(xiàng)移動顧客的特性參數(shù)以外,本研究運(yùn)用生活熵作為刻畫顧客移動規(guī)律的重要特性參數(shù)之一。生活熵大的顧客移動軌跡相對不規(guī)則,難以預(yù)測。而生活熵小的用則否,在特定時(shí)間粒度下有固定的行為模式。生活熵是將顧客的移動信息視為離散時(shí)間序列。假設(shè)x(t)為時(shí)間指標(biāo)t所在的位置,則該顧客的生活熵LEuserLE其中n為顧客位置信息總共的時(shí)間段,以及Ψ為全部的位置集合。圖4將顯示生活熵的統(tǒng)計(jì)成果,縱軸與橫軸分別代表對應(yīng)顧客數(shù)與全體顧客的比例與生活熵。成果顯示75%的顧客生活熵低于16,由于生活熵低于20的顧客是屬于移動規(guī)律或甚至較少出門,因此能夠得知該市最少75%的顧客生活規(guī)律,并容易預(yù)測其運(yùn)動軌跡。圖4生活熵分布圖4移動顧客的聚類與分析通過對這批數(shù)據(jù)的統(tǒng)計(jì)與分析后,提取出上述的特性參數(shù)。本研究使用Z-score算法對這些特性參數(shù)先進(jìn)行歸一化解決,再用K-Means聚類算法迭代25次之后,通過對聚類中心的分析,將聚類出的四類顧客成果分別與消費(fèi)能力、通話量、網(wǎng)絡(luò)請求量、位移量的特性參數(shù)關(guān)系展示在圖5。圖5聚類類型與特性關(guān)系圖規(guī)律通話型顧客有規(guī)律的日?;顒樱咳盏囊苿恿颗c移動路線大同小異,平均生活熵低,90%以上的顧客使用電信運(yùn)行商提供的動感地帶品牌,使用的手機(jī)系統(tǒng)種類多且相對均勻,平時(shí)運(yùn)用手機(jī)移動上網(wǎng)需求少,而在上下班時(shí)間網(wǎng)絡(luò)請求占的比重稍高,表達(dá)顧客平時(shí)多有處在含有無線上網(wǎng)的區(qū)域停留,進(jìn)而可判斷這類顧客以固定坐班的上班族和以通話業(yè)務(wù)為主的商務(wù)人士為主。另外,這類顧客盡管通話次數(shù)較少,但平均通話時(shí)長高。隨機(jī)上網(wǎng)型顧客的平均生活熵高表達(dá)日常移動量大,沒有規(guī)律移動量與行動路線,80%以上的顧客使用電信運(yùn)行商提供的動感地帶品牌,并且使用的手機(jī)系統(tǒng)種類以蘋果機(jī)為主,使用手機(jī)移動上網(wǎng)的需求量是這四類中最高的,進(jìn)而能夠判斷這類顧客屬于年輕群體或高消費(fèi)族群的移動上班族。居家節(jié)省型顧客的生活熵和位移量均最低,95%以上的顧客使用電信運(yùn)行商提供的神州行品牌,使用的手機(jī)系統(tǒng)中普通系統(tǒng)或其它安卓系統(tǒng)占70%以上,平時(shí)運(yùn)用手機(jī)移動上網(wǎng)需求也極少且請求的時(shí)間均勻,并且通話量與通話時(shí)長是四類顧客中最少的,表達(dá)顧客平時(shí)多在某些地區(qū)停留,并只用手機(jī)進(jìn)行簡樸的通話與交流,不常以手機(jī)作為上網(wǎng)的工具,且消費(fèi)能力普通,進(jìn)而可判斷這類顧客以退休老年人、家庭主婦、青少年或小孩等為主,不善使用高端手機(jī)的人群。隨機(jī)高消費(fèi)型的聚類顧客數(shù)是四類中最低的,但這類顧客在消費(fèi)能力和位移量兩個維度下與其它類差別明顯。這類顧客通話耗費(fèi)高,40%以上的顧客使用電信運(yùn)行商提供的全球通品牌,使用的手機(jī)系統(tǒng)多以高端安卓與蘋果系統(tǒng)為主,除了通話量與平均通話時(shí)長都是四類中最高的,平時(shí)運(yùn)用手機(jī)移動上網(wǎng)需求也非常高,通話、上網(wǎng)請求都不與上下班時(shí)間有明顯的關(guān)系,加上這類顧客的生活熵與平均移動量都是四類最高的,表達(dá)顧客平時(shí)多處在移動狀態(tài),運(yùn)用手機(jī)移動上網(wǎng)與通話的需求量大,進(jìn)而可判斷這類顧客有大量業(yè)務(wù)需求的商務(wù)人士或無固定上班時(shí)間的高階主管。5結(jié)語本研究對12月一周的一批移動顧客的基本信息、通話統(tǒng)計(jì)、上網(wǎng)統(tǒng)計(jì)、以及使用基站地理位置等統(tǒng)計(jì)進(jìn)行了分析,通過消費(fèi)能力、通話量、網(wǎng)絡(luò)請求量、位移量四個維度提取顧客行為的14個特性,歸一化解決后,運(yùn)用K-Means算法聚類,得出四個含有比較明顯特性的顧客類別:規(guī)律通話型、隨機(jī)上網(wǎng)型、居家節(jié)省型和隨機(jī)高消費(fèi)型。運(yùn)用這分類模型,總結(jié)每類移動顧客特性與提出有關(guān)的服務(wù)建議,提供電信運(yùn)行商或有關(guān)公司強(qiáng)化顧客需求的服務(wù)內(nèi)容。規(guī)律通話型顧客,日常生活比較規(guī)律,消費(fèi)能力普通,上下班時(shí)間網(wǎng)絡(luò)請求比重高。針對這一類顧客,建議電信運(yùn)行商能夠提供綜合性優(yōu)惠套餐,例如將通話、上網(wǎng)流量的優(yōu)惠配合簡樸型手機(jī)的捆綁銷售。同時(shí)基于顧客位置推送實(shí)時(shí)周邊信息(點(diǎn)評推薦、優(yōu)惠信息、訂購信息、餐飲信息等),以及配合實(shí)時(shí)的天氣、交通信息提高顧客使用的愛好。隨機(jī)上網(wǎng)型顧客,行動比較沒有規(guī)律,平均移動量比較大,顧客消費(fèi)能力比較高,且有使用網(wǎng)絡(luò)的需求。由于這類顧客有年輕化與追求流行的趨勢,建議能夠提供優(yōu)惠的流量套餐,推送新潮商品的信息(數(shù)字產(chǎn)品、流行服飾、媒體影音等),以及配合實(shí)時(shí)的電影院、餐廳等優(yōu)惠信息提高顧客使用的愛好。居家節(jié)省型顧客,日常生活比較單純,消費(fèi)能力低,在通話和上網(wǎng)方面需求量小。建議電信運(yùn)行商能夠提供家庭優(yōu)惠套餐,將通話、上網(wǎng)流量配合對應(yīng)的顧客共同分享數(shù)據(jù)量與信息。同時(shí)基于顧客位置推送與其它顧客實(shí)時(shí)共享信息,以及配合家用電器、學(xué)習(xí)資訊及快餐、超市商場優(yōu)惠信息提高顧客使用的愛好。隨機(jī)高消費(fèi)型顧客,消費(fèi)能力和日常移動明顯比其它類顧客高,活動途徑也不規(guī)律,通話與使用網(wǎng)絡(luò)的需求也是最大的。建議電信運(yùn)行商能夠配合高端商場與百貨公司提供線上線下(O2O,On-linetoOff-line)的應(yīng)用服務(wù),同時(shí)基于顧客位置推送高端商品、理財(cái)?shù)膬?yōu)惠或即時(shí)信息(黃金珠寶、實(shí)時(shí)股市、銀行交易等)提高顧客使用的愛好。隨著移動顧客數(shù)量的快速增加,基于地理位置結(jié)合通信與上網(wǎng)數(shù)據(jù)挖掘已成為移動顧客行為分析領(lǐng)域的熱點(diǎn)研究方向之一。由于移動顧客的數(shù)據(jù)請求時(shí)間不持續(xù),信息需求的地區(qū)性強(qiáng),通過移動智能終端設(shè)備統(tǒng)計(jì)顧客的地理位置信息,合并電信運(yùn)行商的數(shù)據(jù),加以模擬顧客軌跡預(yù)測顧客下一種位置,將顧客通話內(nèi)容、使用互聯(lián)網(wǎng)與應(yīng)用服務(wù)的日志等數(shù)據(jù)信息相結(jié)合顧客行為分析后,進(jìn)而提供個性化的服務(wù)是將來移動顧客行為研究的一種重要方向。參考文獻(xiàn):[1]HungCC,PengWC.Aregression-basedapproachforminingusermovementpatternsfromrandomsampledata[J].Data&KnowledgeEngineering,,70(1):1-20.[2]ZhuY,ZhangY,ShangW,etal.Trajectoryenabledservicesupportplatformformobileusers'behaviorpatternmining[C].MobileandUbiquitousSystems:Networking&Services,MobiQuitous,.MobiQuitous'09.6thAnnualInternational.IEEE,:1-10.[3]AkoushS,SamehA.Mobileusermovementpredictionusingbayesianlearningforneuralnetworks[C].ProceedingsoftheinternationalconferenceonWirelesscommunicationsandmobilecomputing.ACM,:191-196.[4]譚鈞元,宋國杰,謝昆青,等.一種有效的基于生活熵的移動顧客分類算法[J].計(jì)算機(jī)研究與發(fā)展,,46(46):433-438.[5]ShadSA.移動顧客軌跡與行為模式挖掘辦法研究[D].中國科學(xué)技術(shù)大學(xué),.[6]梁鵬,李兵,郭文君.移動數(shù)據(jù)業(yè)務(wù)顧客行為模型研究[J].中興通訊技術(shù),,11(4):70-74.[7]呂洋.基于顧客行為數(shù)據(jù)分析的移動互聯(lián)業(yè)務(wù)推薦模型[D].華中科技大學(xué),.[8]LiuY,YuanP.AstudyofuserdownloadingbehaviorinmobileInternetusingclickstreamdata[C].IntelligentInformationTechnologyandSecurityInformatics(IITSI),ThirdInternationalSymposiumon.IEEE,:255-257.[9]ZhaoG,LaiW,XuC,etal.AnalysisofUserBehaviorinMobileInternetUsingBipartiteNetwork[C].MobileAd-hocan

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論