Python經(jīng)濟(jì)大數(shù)據(jù)分析 課件 第8章 Python應(yīng)用商品零售購(gòu)物籃分析_第1頁(yè)
Python經(jīng)濟(jì)大數(shù)據(jù)分析 課件 第8章 Python應(yīng)用商品零售購(gòu)物籃分析_第2頁(yè)
Python經(jīng)濟(jì)大數(shù)據(jù)分析 課件 第8章 Python應(yīng)用商品零售購(gòu)物籃分析_第3頁(yè)
Python經(jīng)濟(jì)大數(shù)據(jù)分析 課件 第8章 Python應(yīng)用商品零售購(gòu)物籃分析_第4頁(yè)
Python經(jīng)濟(jì)大數(shù)據(jù)分析 課件 第8章 Python應(yīng)用商品零售購(gòu)物籃分析_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第8章商品零售購(gòu)物籃分析1分析方法與過程目錄背景與挖掘目標(biāo)2上機(jī)實(shí)驗(yàn)3拓展思考4背景與挖掘目標(biāo)現(xiàn)代商品種類繁多,顧客往往會(huì)由于需要購(gòu)買的商品眾多而變得疲于選擇,且顧客并不會(huì)因?yàn)樯唐愤x擇豐富而選擇購(gòu)買更多的商品。例如,貨架上有可口可樂和百事可樂,若顧客需要選購(gòu)可樂若干,或許會(huì)同時(shí)購(gòu)買兩種可樂,但是購(gòu)買可樂的數(shù)量大多數(shù)情況下不會(huì)因?yàn)槠放茢?shù)量增加而增加。背景與挖掘目標(biāo)繁雜的選購(gòu)過程往往會(huì)給顧客疲憊的購(gòu)物體驗(yàn)。對(duì)于某些商品,顧客會(huì)選擇同時(shí)購(gòu)買,如面包與牛奶、薯片與可樂等,當(dāng)面包與牛奶或者薯片與可樂分布在商場(chǎng)的兩側(cè),且距離十分遙遠(yuǎn)時(shí),顧客購(gòu)買的欲望就會(huì)減少,在時(shí)間緊迫的情況下顧客甚至?xí)艞壻?gòu)買某些計(jì)劃購(gòu)買的商品。相反,把牛奶與面包擺放在相鄰的位置,既給顧客提供便利,提升購(gòu)物體驗(yàn),又提高顧客購(gòu)買的概率,達(dá)到了促銷的目的。背景與挖掘目標(biāo)許多商場(chǎng)以打折方式作為主要促銷手段,以更少的利潤(rùn)為代價(jià)獲得更高的銷量。打折往往會(huì)使顧客增加原計(jì)劃購(gòu)買商品的數(shù)量,對(duì)于原計(jì)劃不打算購(gòu)買且不必要的商品,打折的吸引力遠(yuǎn)遠(yuǎn)不足。而正確的商品擺放卻能提醒顧客購(gòu)買某些必需品,甚至吸引他們購(gòu)買感興趣的商品。構(gòu)建零售商品的Apriori關(guān)聯(lián)規(guī)則模型,分析商品之間的關(guān)聯(lián)性。根據(jù)模型結(jié)果給出銷售策略。背景與挖掘目標(biāo)綜合商品零售行業(yè)現(xiàn)狀、提供的數(shù)據(jù),實(shí)現(xiàn)以下目標(biāo)。1分析方法與過程目錄背景與挖掘目標(biāo)2上機(jī)實(shí)驗(yàn)3拓展思考4購(gòu)物籃關(guān)聯(lián)規(guī)則挖掘主要步驟如下:對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)探索性分析,分析商品的熱銷情況與商品結(jié)構(gòu)。對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,轉(zhuǎn)換數(shù)據(jù)形式,使之符合Apriori關(guān)聯(lián)規(guī)則算法要求。在步驟2得到的建模數(shù)據(jù)基礎(chǔ)上,采用Apriori關(guān)聯(lián)規(guī)則算法,調(diào)整模型輸入?yún)?shù),完成商品關(guān)聯(lián)性分析。結(jié)合實(shí)際業(yè)務(wù),對(duì)模型結(jié)果進(jìn)行分析,根據(jù)分析結(jié)果給出銷售建議,最后輸出關(guān)聯(lián)規(guī)則結(jié)果。分析方法與過程數(shù)據(jù)挖掘建模的總體流程:分析方法與過程數(shù)據(jù)分析探索:探索數(shù)據(jù)特征是了解數(shù)據(jù)的第一步。分析商品熱銷情況和商品結(jié)構(gòu),是為了更好地實(shí)現(xiàn)企業(yè)的經(jīng)營(yíng)目標(biāo)。商品管理應(yīng)堅(jiān)持商品齊全和商品優(yōu)選的原則,產(chǎn)品銷售基本滿足“二八定律”即80%的銷售額是由20%的商品創(chuàng)造的,這些商品是企業(yè)主要盈利商品,要作為商品管理的重中之重。商品熱銷情況分析和商品結(jié)構(gòu)分析也是商品管理不可或缺的一部分,其中商品結(jié)構(gòu)分析能夠幫助保證商品的齊全性,熱銷情況分析可以助力于商品優(yōu)選。分析方法與過程數(shù)據(jù)分析探索:某商品零售企業(yè)共收集了9835個(gè)購(gòu)物籃的數(shù)據(jù),購(gòu)物籃數(shù)據(jù)主要包括3個(gè)屬性:id、Goods和Types。屬性的具體說明如表所示。分析方法與過程表名屬性名稱屬性說明GoodsOrderid商品所屬類別的編號(hào)Goods具體的商品名稱GoodsTypesGoods具體的商品名稱Types商品類別第一步:數(shù)據(jù)特征探索數(shù)據(jù)的特征,查看每列屬性、最大值、最小值,是了解數(shù)據(jù)的第一步。第二步:分析熱銷商品商品熱銷情況分析是商品管理不可或缺的一部分,熱銷情況分析可以助力于商品優(yōu)選。計(jì)算銷量排行前10商品的銷量及占比,并繪制條形圖顯示銷量前10商品的銷量情況。分析方法與過程第二步:分析熱銷商品銷量排行前10商品的銷量及其占比情況,如下表所示。分析方法與過程商品名稱銷量銷量占比全脂牛奶25135.795%其他蔬菜19034.388%面包卷18094.171%蘇打17153.955%酸奶13723.164%瓶裝水10872.507%根莖類蔬菜10722.472%熱帶水果10322.380%購(gòu)物袋9692.234%香腸9242.131%第二步:分析熱銷商品銷量排行前10商品的銷量,如下表所示。通過分析熱銷商品的結(jié)果可知,全脂牛奶銷售量最高,銷量為2513件,占比5.795%;其次是其他蔬菜、面包卷和蘇打,占比分別為4.388%、4.171%、3.955%。分析方法與過程第三步:分析商品結(jié)構(gòu)對(duì)每一類商品的熱銷程度進(jìn)行分析,有利于商家制定商品在貨架的擺放策略和位置,若是某類商品較為熱銷,商場(chǎng)可以把此類商品擺放到商場(chǎng)的中心位置,方便顧客選購(gòu)?;蛘叻旁谏虉?chǎng)深處位置,使顧客在購(gòu)買熱銷商品前經(jīng)過非熱銷商品,增加在非熱銷商品處的停留時(shí)間,促進(jìn)非熱銷產(chǎn)品的銷量。分析方法與過程第三步:分析商品結(jié)構(gòu)原始數(shù)據(jù)中的商品本身已經(jīng)過歸類處理,但是部分商品還是存在一定的重疊,故再次對(duì)其進(jìn)行歸類處理。分析歸類后各類別商品的銷量及其占比,并繪制餅圖顯示各類商品的銷量占比情況。分析方法與過程商品類別銷量銷量占比非酒精飲料759417.51%西點(diǎn)719216.58%果蔬714616.48%米糧調(diào)料518511.96%百貨514111.85%肉類487011.23%酒精飲料22875.27%食品類18704.31%零食14593.36%熟食5411.25%第三步:分析商品結(jié)構(gòu)通過分析各類別商品的銷量及其占比情況可知,非酒精飲料、西點(diǎn)、果蔬三類商品銷量差距不大,占總銷量的50%左右,同時(shí),根據(jù)大類劃分發(fā)現(xiàn)和食品相關(guān)的類的銷量總和接近90%,說明了顧客傾向于購(gòu)買此類產(chǎn)品,而其余商品僅為商場(chǎng)滿足顧客的其余需求而設(shè)定,并非銷售的主力軍。分析方法與過程第三步:分析商品結(jié)構(gòu)查看銷量第一的非酒精飲料類商品的內(nèi)部商品結(jié)構(gòu),并繪制餅圖顯示其銷量占比情況。分析方法與過程商品類別銷量銷量占比全脂牛奶251333.09%蘇打171522.58%瓶裝水108714.31%水果/蔬菜汁7119.36%咖啡5717.52%超高溫殺菌的牛奶3294.33%其他飲料2793.67%一般飲料2563.37%速溶咖啡730.96%茶380.50%可可飲料220.29%第三步:分析商品結(jié)構(gòu)通過分析非酒精飲料內(nèi)部商品的銷量及其占情況可知,全脂牛奶的銷量在非酒精飲料的總銷量中占比超過33%,前3種非酒精飲料的銷量在非酒精飲料的總銷量中占比接近70%,說明了大部分顧客到店購(gòu)買的飲料為這三種,需要時(shí)常注意貨物的庫(kù)存,定期補(bǔ)貨必不可少。分析方法與過程數(shù)據(jù)預(yù)處理:通過對(duì)數(shù)據(jù)探索分析,發(fā)現(xiàn)數(shù)據(jù)數(shù)據(jù)完整,并不存在缺失值。建模之前需要建模之前需要轉(zhuǎn)變數(shù)據(jù)的格式,才能使用apriori函數(shù)進(jìn)行關(guān)聯(lián)分析。分析方法與過程模型構(gòu)建:采用關(guān)聯(lián)規(guī)則算法,挖掘它們之間的關(guān)聯(lián)關(guān)系。關(guān)聯(lián)規(guī)則算法主要用于尋找數(shù)據(jù)中項(xiàng)集之間的關(guān)聯(lián)關(guān)系。它揭示了數(shù)據(jù)項(xiàng)間的未知關(guān)系,基于樣本的統(tǒng)計(jì)規(guī)律,進(jìn)行關(guān)聯(lián)規(guī)則分析。根據(jù)所分析的關(guān)聯(lián)關(guān)系,可從一個(gè)屬性的信息來推斷另一個(gè)屬性的信息。當(dāng)置信度達(dá)到某一閾值時(shí),就可以認(rèn)為規(guī)則成立。Apriori算法是常用的關(guān)聯(lián)規(guī)則算法之一,也是最為經(jīng)典的分析頻繁項(xiàng)集的算法,第一次實(shí)現(xiàn)在大數(shù)據(jù)集上可行的關(guān)聯(lián)規(guī)則提取的算法。除此之外,還有FP-Tree算法,Eclat算法和灰色關(guān)聯(lián)算法等。主要使用Apriori算法進(jìn)行分析。分析方法與過程第一步:商品購(gòu)物籃關(guān)聯(lián)規(guī)則模型構(gòu)建本次商品購(gòu)物籃關(guān)聯(lián)規(guī)則建模的流程如圖所示。分析方法與過程第一步:商品購(gòu)物籃關(guān)聯(lián)規(guī)則模型構(gòu)建模型主要由輸入、算法處理、輸出3個(gè)部分組成。輸入部分包括:建模樣本數(shù)據(jù)的輸入;建模參數(shù)的輸入。算法處理部分是采用Apriori關(guān)聯(lián)規(guī)則算法進(jìn)行處理。輸出部分為采用Apriori關(guān)聯(lián)規(guī)則算法進(jìn)行處理后的結(jié)果。分析方法與過程第一步:商品購(gòu)物籃關(guān)聯(lián)規(guī)則模型構(gòu)建模型具體實(shí)現(xiàn)步驟為:首先設(shè)置建模參數(shù)最小支持度、最小置信度,輸入建模樣本數(shù)據(jù);然后采用Apriori關(guān)聯(lián)規(guī)則算法對(duì)建模的樣本數(shù)據(jù)進(jìn)行分析,以模型參數(shù)設(shè)置的最小支持度、最小置信度以及分析目標(biāo)作為條件,如果所有的規(guī)則都不滿足條件,則需要重新調(diào)整模型參數(shù),否則輸出關(guān)聯(lián)規(guī)則結(jié)果。分析方法與過程第一步:商品購(gòu)物籃關(guān)聯(lián)規(guī)則模型構(gòu)建目前,如何設(shè)置最小支持度與最小置信度,并沒有統(tǒng)一的標(biāo)準(zhǔn)。大部分都是根據(jù)業(yè)務(wù)經(jīng)驗(yàn)設(shè)置初始值,然后經(jīng)過多次調(diào)整,獲取與業(yè)務(wù)相符的關(guān)聯(lián)規(guī)則結(jié)果。本案例經(jīng)過多次調(diào)整并結(jié)合實(shí)際業(yè)務(wù)分析,選取模型的輸入?yún)?shù)為:最小支持度0.02、最小置信度0.35。運(yùn)行關(guān)聯(lián)規(guī)則代碼,得到結(jié)果如下圖。分析方法與過程第二步:模型分析根據(jù)多次試驗(yàn),得出了26個(gè)關(guān)聯(lián)規(guī)則。根據(jù)規(guī)則結(jié)果,可整理出購(gòu)物籃關(guān)聯(lián)規(guī)則模型結(jié)果。分析方法與過程lhs

rhs支持度置信度lift{'水果/蔬菜汁'}=>{'全脂牛奶'}0.026640.3684951.44216{'人造黃油'}=>{'全脂牛奶'}0.0241990.4131941.617098{'仁果類水果'}=>{'全脂牛奶'}0.0300970.3978491.557043{'牛肉'}=>{'全脂牛奶'}0.0212510.4050391.58518{'冷凍蔬菜'}=>{'全脂牛奶'}0.0204370.4249471.663094{'本地蛋類'}=>{'其他蔬菜'}0.0222670.3509621.813824{'黃油'}=>{'其他蔬菜'}0.0200310.3614681.868122{'本地蛋類'}=>{'全脂牛奶'}0.0299950.4727561.850203{'黑面包'}=>{'全脂牛奶'}0.0252160.3887151.521293{'糕點(diǎn)'}=>{'全脂牛奶'}0.0332490.3737141.462587{'酸奶油'}=>{'其他蔬菜'}0.0288760.4028372.081924{'豬肉'}=>{'其他蔬菜'}0.0216570.3756611.941476{'酸奶油'}=>{'全脂牛奶'}0.0322320.4496451.759754分析方法與過程lhs

rhs支持度置信度lift{'豬肉'}=>{'全脂牛奶'}0.0221660.384481.504719{'根莖類蔬菜'}=>{'全脂牛奶'}0.0489070.4486941.756031{'根莖類蔬菜'}=>{'其他蔬菜'}0.0473820.4347012.246605{'凝乳'}=>{'全脂牛奶'}0.0261310.4904581.919481{'熱帶水果'}=>{'全脂牛奶'}0.0422980.4031011.577595{'柑橘類水果'}=>{'全脂牛奶'}0.0305030.368551.442377{'黃油'}=>{'全脂牛奶'}0.0275550.4972481.946053{'酸奶'}=>{'全脂牛奶'}0.0560240.4016031.571735{'其他蔬菜'}=>{'全脂牛奶'}0.0748350.3867581.513634{'其他蔬菜','酸奶'}=>{'全脂牛奶'}0.0222670.5128812.007235{'全脂牛奶','酸奶'}=>{'其他蔬菜'}0.0222670.3974592.054131{'根莖類蔬菜','全脂牛奶'}=>{'其他蔬菜'}0.0231830.4740122.44977{'根莖類蔬菜','其他蔬菜'}=>{'全脂牛奶'}0.0231830.489271.914833第二步:模型分析輸出結(jié)果分析,顧客購(gòu)買酸奶和其他蔬菜的時(shí)候會(huì)同時(shí)購(gòu)買全脂牛奶,其置信度最大達(dá)到51,29%。其他蔬菜、根莖類蔬菜和全脂牛奶同時(shí)購(gòu)買的概率較高。從購(gòu)物者角度進(jìn)行分析:現(xiàn)代生活中,大多數(shù)購(gòu)物者為家庭煮婦,購(gòu)買的商品大部分是食品,隨著生活質(zhì)量和健康意識(shí)的增加,其他蔬菜、根莖類蔬菜和全脂牛奶均為現(xiàn)代家庭每日飲食所需品,因此,其他蔬菜、根莖類蔬菜和全脂牛奶同時(shí)購(gòu)買的概率較高符合現(xiàn)代人們的生活健康意識(shí)。分析方法與過程第三步:模型應(yīng)用模型結(jié)果表明顧客購(gòu)買商品的時(shí)候會(huì)同時(shí)購(gòu)買全脂牛奶。因此,商場(chǎng)應(yīng)該根據(jù)實(shí)際情況將全脂牛奶放在顧客購(gòu)買商品的必經(jīng)之路,或者商場(chǎng)顯眼位置,方便顧客拿取。其他蔬菜、根莖類蔬菜、酸奶油、豬肉、黃油、本地蛋類和多種水果同時(shí)購(gòu)買的概率較高,可以考慮捆綁銷售,或者適當(dāng)調(diào)整商場(chǎng)布置,將這些商品的距離盡量拉近,提升購(gòu)物體驗(yàn)。分析方法與過程1分析方法與過程目錄背景與挖掘目標(biāo)2上機(jī)實(shí)驗(yàn)3拓展思考4實(shí)驗(yàn)?zāi)康睦胮andas快速實(shí)現(xiàn)數(shù)據(jù)的預(yù)處理分析以及實(shí)現(xiàn)關(guān)聯(lián)算法的過程。了解Apriori關(guān)聯(lián)規(guī)則算法在購(gòu)物籃分析實(shí)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論