【《基于聚類分析、主成分分析和時(shí)間序列分析法的零售行業(yè)銷售預(yù)測分析》13000字】_第1頁
【《基于聚類分析、主成分分析和時(shí)間序列分析法的零售行業(yè)銷售預(yù)測分析》13000字】_第2頁
【《基于聚類分析、主成分分析和時(shí)間序列分析法的零售行業(yè)銷售預(yù)測分析》13000字】_第3頁
【《基于聚類分析、主成分分析和時(shí)間序列分析法的零售行業(yè)銷售預(yù)測分析》13000字】_第4頁
【《基于聚類分析、主成分分析和時(shí)間序列分析法的零售行業(yè)銷售預(yù)測分析》13000字】_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

基于聚類分析、主成分分析和時(shí)間序列分析法的零售行業(yè)銷售預(yù)測研究摘要傳統(tǒng)零售行業(yè)發(fā)展了若干年,國內(nèi)零售企業(yè)主要依靠傳統(tǒng)管理方式和方法,缺乏創(chuàng)新能力、市場細(xì)分,缺乏技術(shù)支持,信息化程度不高。而隨著科學(xué)技術(shù)的發(fā)展以及大數(shù)據(jù)時(shí)代的到來,我國傳統(tǒng)零售行業(yè)面臨著許多新的問題和挑戰(zhàn)。在大數(shù)據(jù)時(shí)代,使用數(shù)據(jù)分析,為了幫助企業(yè)提升管理水平、幫助政府采取適當(dāng)政策。在本篇論文中,主要是針對浙江嘉興市零售行業(yè)銷售情況,采用聚類分析、主成分分析、時(shí)間序列分析的方法進(jìn)行分析與預(yù)測,使用matlab進(jìn)行編程,分析嘉興市零售行業(yè)存在的問題,并對于來年的銷售進(jìn)行預(yù)測。根據(jù)所得到的結(jié)果,給出適當(dāng)建議。最后,使用大數(shù)據(jù)分析軟件-FineBI,對零售行業(yè)數(shù)據(jù)進(jìn)行合理化展示,讓決策者能夠更加清晰掌握銷售情況,以便他們做出決策,讓零售行業(yè)更好的發(fā)展。關(guān)鍵詞聚類分析;主成分分析;時(shí)間序列分析;數(shù)據(jù)可視化目錄1引言…………11.1研究背景………………………11.2研究內(nèi)容………………………11.3研究進(jìn)展………………………21.4研究目的和意義…………………22數(shù)據(jù)說明……………32.1數(shù)據(jù)來源………………………32.2數(shù)據(jù)預(yù)處理……………………33數(shù)據(jù)分析…………73.1對企業(yè)類型、主要行業(yè)和零售形態(tài)進(jìn)行聚類分析……………73.1.1聚類分析原理…………………73.1.2對企業(yè)類型進(jìn)行聚類分析……………………83.1.3對主要行業(yè)進(jìn)行聚類分析……………………93.1.4對零售形態(tài)進(jìn)行聚類分析…………………113.2基于主成分分析研究每年對嘉興市銷售收入的影響因素…123.2.1主成分分析原理……………123.2.2代碼及結(jié)果分析……………143.3基于時(shí)間序列分析對各個(gè)年份嘉興市的銷售收入預(yù)測……163.3.1時(shí)間序列分析原理

…………163.3.2問題分析與模型建立………174數(shù)據(jù)可視化展示…………………254.1數(shù)據(jù)可視化原理………………254.2各類具體情況的分析…………254.2.1對企業(yè)登記類型分析………254.2.2對主要行業(yè)類型分析………284.2.3對零售形態(tài)分析……………304.3各個(gè)年份銷售額分析與預(yù)測…………………32結(jié)論…………………34參考文獻(xiàn)………………36第1頁1引言近年來,隨著市場經(jīng)濟(jì)的發(fā)展,各行各業(yè)競爭激烈,特別是零售業(yè)之間的競爭非常激烈。而傳統(tǒng)零售行業(yè)主要依靠傳統(tǒng)管理方式和方法,缺乏科學(xué)的市場管理與技術(shù)支持,信息化程度不夠。導(dǎo)致我國國內(nèi)零售企業(yè)較外企來說相對落后。為了提高零售行業(yè)的競爭力,做出更加精準(zhǔn)、廣闊的布局。在大數(shù)據(jù)時(shí)代,使用數(shù)學(xué)建模,對數(shù)據(jù)的深層含義進(jìn)行具體分析,對其進(jìn)行預(yù)測,這就顯得尤其重要。將數(shù)學(xué)分析應(yīng)用到各個(gè)行業(yè)領(lǐng)域,可以幫助企業(yè)提升管理水平,幫助政府提高管理效率,給出適當(dāng)建議。1.1研究背景傳統(tǒng)零售行業(yè)發(fā)展了若干年,而隨著科學(xué)技術(shù)的發(fā)展以及大數(shù)據(jù)時(shí)代的到來,我國傳統(tǒng)零售行業(yè)面臨著許多新的問題和挑戰(zhàn)。根據(jù)美國零售協(xié)會(huì)發(fā)布的全球250強(qiáng)零售商數(shù)據(jù),前150家企業(yè)中,美國有51家企業(yè)入圍,占比34%,日本零售企業(yè)排名第二,占比7.33%,而我國僅占比5.3%。說明我國國內(nèi)零售企業(yè)較外企相對落后,國內(nèi)零售企業(yè)主要依靠傳統(tǒng)管理方式和方法,缺乏創(chuàng)新能力、市場細(xì)分,缺乏技術(shù)支持,信息化程度不高。由于線上電商平臺(tái)、線下零售行業(yè)的競爭,使得零售企業(yè)必須做出更加精準(zhǔn)、更加廣闊的布局,才能夠在市場上占據(jù)一席之地。企業(yè)管理亟需升級創(chuàng)新,在大數(shù)據(jù)時(shí)代,學(xué)會(huì)使用數(shù)學(xué)建模思想,對數(shù)據(jù)深層含義進(jìn)行具體分析,并對其進(jìn)行預(yù)測,這就顯得尤為重要。1.2研究內(nèi)容本課題通過對零售行業(yè)銷售分析與預(yù)測的研究,利用matlab進(jìn)行建模,采用浙江省嘉興市的零售行業(yè)銷售數(shù)據(jù),通過聚類分析對企業(yè)類型、主要行業(yè)、零售形態(tài)進(jìn)行劃分,由分類結(jié)果可識(shí)別出發(fā)展較好的企業(yè)與發(fā)展不好的企業(yè)、收益好的行業(yè)以及收益不好的行業(yè)、好的零售形態(tài)和不好的零售形態(tài),并給出適當(dāng)建議;再根據(jù)銷售數(shù)據(jù),進(jìn)行主成分分析,研究每年對嘉興市銷售收入的影響因素,進(jìn)行分析,給出解決問題的建議;最后,通過時(shí)間序列法對各個(gè)年份嘉興市的銷售收入進(jìn)行分析與預(yù)測,得到總的預(yù)測分析結(jié)果,并對未來零售行業(yè)的經(jīng)營給出恰當(dāng)建議。1.3研究進(jìn)展本課題對零售行業(yè)銷售情況進(jìn)行分析,利用聚類分析對企業(yè)類型、主要行業(yè)、銷售形態(tài)進(jìn)行了劃分,讓企業(yè)和政府快速了解到哪類類別發(fā)展情況較好,最好督促較差類的發(fā)展,促進(jìn)和提高較好類的發(fā)展。政府可以對第一類的類型進(jìn)行適當(dāng)?shù)恼叻龀郑哟笸苿?dòng)第二類類型的發(fā)展。其次,對于嘉興市的銷售收入進(jìn)行研究,使用主成分分析方法,深入分析研究其影響因素。從結(jié)果中,我們發(fā)現(xiàn)經(jīng)營費(fèi)用、主營業(yè)務(wù)利潤、管理費(fèi)用在其中的影響較大。最后,我們研究對各個(gè)年份的銷售收入的預(yù)測情況。得到了2020年-2022年的銷售收入的預(yù)測數(shù)據(jù)。發(fā)現(xiàn)未來三年銷售收入呈現(xiàn)緩慢遞增的趨勢。這更使得管理者需要分析和研究銷售行業(yè)的數(shù)據(jù)信息,實(shí)現(xiàn)銷售收入的顯著增加。1.4研究目的和意義本課題研究對零售行業(yè)的銷售分析與預(yù)測,目的是為了將數(shù)據(jù)分析應(yīng)用到各個(gè)行業(yè)領(lǐng)域,可以幫助企業(yè)提升管理水平,幫助政府采取適當(dāng)政策。采用數(shù)學(xué)建模的思想,去對浙江嘉興市零售行業(yè)銷售情況進(jìn)行分析,然后對其銷售情況進(jìn)行預(yù)測。幫助解決該市零售行業(yè)所面臨的問題,最后通過數(shù)據(jù)可視化進(jìn)行展示。

2數(shù)據(jù)說明2.1數(shù)據(jù)來源本篇論文中采用的數(shù)據(jù)來源于中國經(jīng)濟(jì)社會(huì)大數(shù)據(jù)研究平臺(tái)的嘉興統(tǒng)計(jì)年鑒,是浙江嘉興市2019年全市的批發(fā)零售行業(yè)的銷售數(shù)據(jù)。數(shù)據(jù)表中包含了2008年-2019年的企業(yè)個(gè)數(shù)、虧損企業(yè)、商品銷售收入、商品銷售成本、經(jīng)營費(fèi)用、主營業(yè)務(wù)利潤、管理費(fèi)用、財(cái)務(wù)費(fèi)用共八個(gè)指標(biāo),以及將零售企業(yè)按照注冊登記類型、主要行業(yè)、零售形態(tài)分類依據(jù)以上八個(gè)指標(biāo)分類,還有其他無關(guān)指標(biāo)如:利息支出、營業(yè)利潤、利潤總額、應(yīng)付工資、應(yīng)付福利費(fèi)總額、應(yīng)付職工薪酬、應(yīng)交增稅、流動(dòng)資產(chǎn)、存貨等九個(gè)指標(biāo),總共約300條數(shù)據(jù)。2.2數(shù)據(jù)預(yù)處理在該數(shù)據(jù)表中,我們將空值、無關(guān)值等數(shù)據(jù)進(jìn)行預(yù)處理。篩選出我們需要的、正確的數(shù)據(jù)。我們將上表大致分為五個(gè)子表。表2-1企業(yè)類型的相關(guān)指標(biāo)指標(biāo)企業(yè)類型企業(yè)個(gè)數(shù)/個(gè)虧損企業(yè)/個(gè)商品銷售收入/萬元商品銷售成本/萬元經(jīng)營費(fèi)用/萬元主營業(yè)務(wù)利潤/萬元管理費(fèi)用/萬元財(cái)務(wù)費(fèi)用/萬元1國有企業(yè)102625226118435811352集體企業(yè)512800222653197242002472683股份合作企業(yè)70140521153512332465457384有限責(zé)任公司74291068123950631622761001853707453525股份有限公司422493702261612186618303209233876私營企業(yè)298912717197236236721962633018186544172247其他企業(yè)10700696040-18港澳臺(tái)商投資企業(yè)1325713485030643553164525153527539外商投資企業(yè)6225926023374112286211422829414表2-2主要行業(yè)的相關(guān)指標(biāo)指標(biāo)主要行業(yè)企業(yè)個(gè)數(shù)/個(gè)虧損企業(yè)/個(gè)商品銷售收入/元商品銷售成本/元經(jīng)營費(fèi)用/元主營業(yè)務(wù)利潤/元管理費(fèi)用/元財(cái)務(wù)費(fèi)用/元1綜合零售業(yè)5121864288710339914231293534298062782百貨零售16549029140496831847672273403746693超級市場零售26133618492958465533959717840015734食品、飲料及煙草專門零售業(yè)142639675298932211068455601445紡織、服裝及日用品專門零售業(yè)176224483137622747798089130154326文化、體育用品及器材專門零售業(yè)15489404714018507169364683-5797醫(yī)藥及醫(yī)療器材專門零售業(yè)2811145180113540189142994792356108汽車、摩托車、燃料及零配件專門零售業(yè)195662884497266020111346320519955882191799家用電器及電子產(chǎn)品專門零售業(yè)4471842381602101596723042854572410五金、家具及室內(nèi)裝修材料專門零售業(yè)72923885802406253417811無店鋪及其他零售業(yè)388445382398226284604468716693373表2-3主要零售形態(tài)的相關(guān)指標(biāo)指標(biāo)零售形態(tài)企業(yè)個(gè)數(shù)/個(gè)虧損企業(yè)/個(gè)商品銷售收入/元商品銷售成本/元經(jīng)營費(fèi)用/元主營業(yè)務(wù)利潤/元管理費(fèi)用/元財(cái)務(wù)費(fèi)用/元1有店鋪零售37511744595713907513326211498279130718268022食雜店2012611121481394003便利店7329530234124095586428532904超市227124560103623170281729344019255大型超市130257144210493409654291830115246百貨店18651568042161336616766893619547877專業(yè)店1713912436551085822881801492143968960228專賣店136512251661202840213772420748443526140539家居建材商店111350129604748010購物中心10452637125758071343511廠家直銷中心413020328020980-217482116512無店鋪零售341045110740559628763430831621543813網(wǎng)上商店319434743391317277784104315100440

表2-42008年-2017年銷售總表(單位:萬元/個(gè)企業(yè))指標(biāo)經(jīng)營費(fèi)用主營業(yè)務(wù)利潤管理費(fèi)用財(cái)務(wù)費(fèi)用2008318.20852.13225.5669.692009313.65705.93214.5345.422010341.58725.48227.9072.242011359.92741.68221.0586.792012348.50683.14221.91106.702013368.47840.17252.21114.352014343.62720.44208.17107.322015335.13703.39210.3384.782016379.59798.35244.73122.842017431.05911.43254.78134.832018475.28926.79266.12101.532019482.071024.76309.14127.17表2-52008年-2019年商品銷售收入總表序號年份商品銷售收入12008775945122009746017232010102122384201114177398520121539326062013180126347201419058325820151787504792016187504581020172170498611201824858004122019287971373數(shù)據(jù)分析在數(shù)據(jù)分析部分,我們主要采用聚類分析、主成分分析、時(shí)間序列分析三個(gè)板塊去研究零售行業(yè)的銷售分析與預(yù)測情況。3.1對企業(yè)類型、主要行業(yè)和零售形態(tài)進(jìn)行聚類分析3.1.1聚類分析原理聚類分析實(shí)際上是一種研究“物以類聚”的多元統(tǒng)計(jì)分析方法,聚類分析的方法很多,有:系統(tǒng)聚類法、動(dòng)態(tài)聚類法、模糊聚類法、聚類預(yù)報(bào)法、有序樣品聚類法、圖論聚類法等。[1]本篇論文的聚類分析中,主要采用系統(tǒng)聚類法去解決問題。在使用聚類分析時(shí),首先,我們要確定分類統(tǒng)計(jì)量,測定樣本間的親疏程度,主要通過樣本間的距離以及相關(guān)系數(shù)來確定;然后,我們可以使用統(tǒng)計(jì)量將樣本進(jìn)行分類。我們研究樣品之間的關(guān)系,去將樣品進(jìn)行合理分類。因?yàn)楸?-1中的變量是定量的,故我們采用間隔尺度。在本論文當(dāng)中,我們要對樣本進(jìn)行分類,采用Q型聚類法。常用的統(tǒng)計(jì)量時(shí)用“距離”來表達(dá)。在系統(tǒng)聚類分析方法中,步驟是:設(shè)樣本數(shù)量為n個(gè),初始時(shí)這n個(gè)樣本各自成為一類,然后計(jì)算各個(gè)樣本之間的距離,將距離最小的一類并為一新類,再計(jì)算并類后的新的類與其他類的距離,又將聚類最小的兩類并為一新類,這樣每次減少一些類,直到將n個(gè)樣品合并成一類,則結(jié)束。[1]常用的聚類分析方法有:最短聚類法、最長距離法、類平均法、可變類平均法、中間距離法、重心法、可變法、離差平方和法。在本論文中,我們采用重心距離法、最長距離法進(jìn)行分類。(1)重心距離法的原理如下:設(shè)Gp,Gq的重心分別是X(p)Dpq=設(shè)某一步將Gp,Gq合并為一類,記為Gr,Gp,Gq的質(zhì)心為XX(r)=則Gr與其他類GD(2)最長距離法的原理如下:該方法實(shí)際上就是將類與類之間距離最長的兩類合并,即Dpq=maxi∈設(shè)某一步將Gp,Gq合并為一類,記為GrDpq=maxi∈再找距離最大的并類,直到所有元素并為一類為止。3.1.2對企業(yè)類型進(jìn)行聚類分析根據(jù)表2-1,對它進(jìn)行分類。這里選取了9種類型的企業(yè)作Q型聚類分析,描述9種企業(yè)信息變量主要有8個(gè):企業(yè)個(gè)數(shù)、虧損個(gè)數(shù)、商品銷售收入、商品銷售成本、經(jīng)營費(fèi)用、主營業(yè)務(wù)利潤、管理費(fèi)用、財(cái)務(wù)費(fèi)用;采用重心距離法,利用matlab編程,得到圖3-1結(jié)果。x=[1 0 2625 2261 184 358 113 55 1 28002 22653 1972 4200 2472 687 0 14052 11535 1233 2465 457 3874 29 1068123 950631 62276 100185 37074 53524 2 249370 226161 21866 18303 2092 3387298 91 2717197 2362367 219626 330181 86544 172241 0 700 696 0 4 0 -113 2 571348 503064 35531 64525 15352 7536 2 259260 233741 12286 21142 2829 414];x2=zscore(x);%數(shù)據(jù)標(biāo)準(zhǔn)化y2=pdist(x2,'euclidean');%采用歐氏距離z2=linkage(y2,'centroid')%采用質(zhì)心距離法c2=cophenet(z2,y2)%利用pdist函數(shù)生成的y2和linkage函數(shù)生成的z2計(jì)算cophenet相關(guān)系數(shù)t=cluster(z2,8)%根據(jù)linkage函數(shù)的輸出z2創(chuàng)建分類h=dendrogram(z2)%生成只有頂部20個(gè)節(jié)點(diǎn)的冰柱圖(譜系圖)圖3-1企業(yè)類型劃分冰柱圖根據(jù)圖3-1可以將企業(yè)類型分為兩類,第一類為國有企業(yè)、集體企業(yè)、股份合作企業(yè)、其他企業(yè);第二類為外商投資企業(yè)、有限責(zé)任公司、股份有限公司、私營企業(yè)、港澳臺(tái)商投資企業(yè);其中,第一類企業(yè)發(fā)展數(shù)量較少,發(fā)展平平;第二類企業(yè)數(shù)量多,發(fā)展較好。建議嘉州市加大力度投資和發(fā)展第一類中的國有企業(yè)、集體企業(yè)等,讓零售行業(yè)發(fā)展的更好。3.1.3對主要行業(yè)進(jìn)行聚類分析根據(jù)表2-2,這里選取了11種零售相關(guān)行業(yè)作Q型聚類分析,描述11種零售行業(yè)的信息變量主要有8個(gè):企業(yè)個(gè)數(shù)、虧損個(gè)數(shù)、商品銷售收入、商品銷售成本、經(jīng)營費(fèi)用、主營業(yè)務(wù)利潤、管理費(fèi)用、財(cái)務(wù)費(fèi)用,采用最長距離法,進(jìn)行劃分;x=[51 21 864288 710339 91423 129353 42980 627816 5 490291 404968 31847 67227 34037 466926 13 361849 295846 55339 59717 8400 157314 2 63967 52989 3221 10684 5560 14417 6 224483 137622 74779 80891 3015 43215 4 89404 71401 8507 16936 4683 -57928 11 145180 113540 18914 29947 9235 610195 66 2884497 2660201 113463 205199 55882 1917944 7 184238 160210 15967 23042 8545 7247 2 9238 8580 240 625 341 7838 8 445382 398226 28460 44687 16693 373];x2=zscore(x);y2=pdist(x2,'euclidean');%采用歐氏距離z2=linkage(y2,'complete');%采用最長距離法h=dendrogram(z2);%生成只有頂部11個(gè)節(jié)點(diǎn)的冰柱圖(譜系圖)圖3-2主要行業(yè)劃分冰柱圖根據(jù)圖3-2可以將主要行業(yè)分為兩類:第一類食品、飲料及煙草專門零售業(yè),文化、體育用品及器材專門零售業(yè),五金、家具及室內(nèi)裝修材料專門零售業(yè),醫(yī)藥及醫(yī)療器材專門零售業(yè),家用電器及電子產(chǎn)品專門零售業(yè),無店鋪及其他零售業(yè);第二類百貨零售,超級市場零售,紡織、服裝及日用品專門零售業(yè),綜合零售業(yè),汽車、摩托車、燃料及零配件專門零售業(yè);其中:第一類行業(yè)發(fā)展較差,第二類行業(yè)發(fā)展較好。建議推動(dòng)第一類零售行業(yè)的發(fā)展,通過線上線上雙結(jié)合的方式,進(jìn)行零售。3.1.4對零售形態(tài)進(jìn)行聚類分析根據(jù)表2-3,這里選取了13種零售形態(tài)作Q型聚類分析,描述13種企業(yè)信息變量主要有8個(gè):企業(yè)個(gè)數(shù)、虧損個(gè)數(shù)、商品銷售收入、商品銷售成本、經(jīng)營費(fèi)用、主營業(yè)務(wù)利潤、管理費(fèi)用、財(cái)務(wù)費(fèi)用,采用重心距離法進(jìn)行分類,x=[375 117 4459571 3907513 326211 498279 130718 268022 0 1261 1121 48 139 40 07 3 29530 23412 4095 5864 2853 29022 7 124560 103623 17028 17293 4401 92513 0 257144 210493 40965 42918 3011 52418 6 515680 421613 36616 76689 36195 4787171 39 1243655 1085822 88180 149214 39689 6022136 51 2251661 2028402 137724 207484 43526 140531 1 1350 1296 0 47 48 01 0 4526 3712 575 807 134 354 1 30203 28020 980 -2174 821 16534 10 451107 405596 28763 43083 16215 43831 9 434743 391317 27778 41043 15100 440];x2=zscore(x);%數(shù)據(jù)標(biāo)準(zhǔn)化y2=pdist(x2,'euclidean');%采用歐氏距離山小z2=linkage(y2,'centroid')%采用質(zhì)心距離法c2=cophenet(z2,y2)%利用pdist函數(shù)生成的y2和linkage函數(shù)生成的z2計(jì)算cophenet相關(guān)系數(shù)t=cluster(z2,8)%根據(jù)linkage函數(shù)的輸出z2創(chuàng)建分類h=dendrogram(z2)%生成只有頂部20個(gè)節(jié)點(diǎn)的冰柱圖(譜系圖)圖3-3零售形態(tài)分類冰柱圖根據(jù)圖3-3,將零售業(yè)形態(tài)可以分為兩類:第一類食雜店、便利店、超市、家居建材商店、購物中心、廠家直銷中心;第二類有店鋪零售、大型超市、無店鋪零售、網(wǎng)上商店、百貨店、專業(yè)店、專賣店;其中第一類發(fā)展較差,第二類發(fā)展較好。建議第一類零售形態(tài)向線上銷售、大型超市合并轉(zhuǎn)型,保證高效銷售,才是未來的正確方向。3.2基于主成分分析研究每年對嘉興市銷售收入的影響因素3.2.1主成分分析原理主成分分析就是一種降維方法,將原來眾多具有一定相關(guān)性的指標(biāo)。重新組合成幾個(gè)新的相互無關(guān)的綜合指標(biāo),并盡可能多的反映原來指標(biāo)的信息。[1]設(shè)有p項(xiàng)指標(biāo)X1X=x11x12其中Xi用矩陣X的p個(gè)向量X1F簡寫成Fi為了不使Fi的方差為無窮大,對上述方程組的系數(shù)要求a1i2Fi與Fj(iF1是X1,X2,...,Xp的一切線性組合(系數(shù)滿足上述方程組)中方差最大的一個(gè),F(xiàn)2是與F定理:在上述條件下,a1i設(shè)F=a其中,a=(a1,a2,...,ap)該定理表明X1,X2,...,Xp的主成分是以?的特征向量為系數(shù)的線性組合,它們互不相關(guān)且其方差為?的特征根,由于?的特征根λ1≥λ2≥...在解決實(shí)際問題時(shí),一般不全取p個(gè)主成分,而是根據(jù)累計(jì)貢獻(xiàn)率的大小取前k個(gè)。稱λii=1p通過上述主成分分析的基本原理,主成分分析計(jì)算步驟如下:對原來的p個(gè)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化,以消除變量在量綱上的影響;根據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣求出相關(guān)系數(shù)矩陣R=(rR=r11r12...r1pr21r求出相關(guān)系數(shù)矩陣的特征根λi(i=1,2,...,p)和對應(yīng)的特征向量ei(i=1,2,...,p),其中計(jì)算主成分貢獻(xiàn)率以及累計(jì)貢獻(xiàn)率,主成分ziλ累計(jì)貢獻(xiàn)率為k=1一般區(qū)累計(jì)貢獻(xiàn)率達(dá)85%~95%的特征根λ1,λ計(jì)算主成分荷載,其計(jì)算公式為aij=p(z對主成分荷載歸一化,對ai=(ai1,ai2寫出主成分的表達(dá)式。3.2.2代碼及結(jié)果分析clc,clearX=[318.20 852.13 225.56 69.69313.65 705.93 214.53 45.42341.58 725.48 227.90 72.24359.92 741.68 221.05 86.79348.50 683.14 221.91 106.70368.47 840.17 252.21 114.35343.62 720.44 208.17 107.32335.13 703.39 210.33 84.78379.59 798.35 244.73 122.84431.05 911.43 254.78 134.83475.28 926.79 266.12 101.53482.07 1024.76 309.14 127.17];x=zscore(X);%數(shù)據(jù)標(biāo)準(zhǔn)化的事std=corrcoef(x);%計(jì)算相關(guān)系數(shù)矩陣[vec,val]=eig(std);%求特征值(val)及特征向量(vec)newval=diag(val);%將特征值作成一個(gè)新向量:[y,i]=sort(newval);%對特征值進(jìn)行排序,y為排序結(jié)果,i為索引rate=y/sum(y)%計(jì)算貢獻(xiàn)率sumrate=0;newi=[];fork=length(y):-1:1sumrate=sumrate+rate(k);newi(length(y)+1-k)=i(k);ifsumrate>0.85break;endend%記下累積貢獻(xiàn)率大于85%的特征值的序號放入newi中fprintf('主成分?jǐn)?shù):%g\nin',length(newi));fori=1:1:length(newi)%計(jì)算載荷aaforj=1:1:length(y)aa(i,j)=sqrt(newval(newi(i)))*vec(j,newi(i));endendaaa=aa.*aa;%主成分載荷歸一化zcfhzfori=1:1:length(newi)forj=1:1:length(y)zcfhz(i,j)=aa(i,j)/sqrt(sum(aaa(i,:)));endendfprintf('主成分載荷:\n'),zcfhz%輸出主成分載荷zcfhz將上述代碼代入得到的結(jié)果為:0.5274、0.5134、0.5293、0.4220;0.0547、0.3871、0.2712、-0.8795;因此,嘉興企業(yè)每年的銷售情況第一、第二主成分為F1=F2=結(jié)果分析:在第一主成分的表達(dá)式中,我們可以看出第一、二、三的系數(shù)比較大,說明商品的銷售收入受經(jīng)營費(fèi)用、主營業(yè)務(wù)利潤、管理費(fèi)用影響較大,這說明當(dāng)適當(dāng)投入經(jīng)營的費(fèi)用以及管理費(fèi)用,并增大主要業(yè)務(wù)的推廣和發(fā)展,使得銷售額會(huì)增長較快;在第二主成分的表達(dá)式中,我們可以看出第一、二的系數(shù)比較大,說明商品的銷售收入受經(jīng)營費(fèi)用、主營業(yè)務(wù)利潤影響較大,這說明當(dāng)適當(dāng)投入經(jīng)營的費(fèi)用并增大主要業(yè)務(wù)的推廣和發(fā)展,使得銷售額會(huì)增長較快;3.3基于時(shí)間序列分析對各個(gè)年份嘉興市的銷售收入預(yù)測3.3.1時(shí)間序列分析原理時(shí)間序列分析是一種數(shù)據(jù)分析的方法,它的研究對象是代表某一現(xiàn)象的一串隨時(shí)間變化而又相關(guān)聯(lián)的數(shù)據(jù)系列,從而描述和探索隨時(shí)間發(fā)展變化的規(guī)律性。[1]時(shí)間序列分析的方法又包括確定性時(shí)序分析和隨機(jī)性時(shí)序分析。兩者的差別是前者是去掉隨機(jī)性因素做一個(gè)確定性分析,后者是根據(jù)分析不同時(shí)刻的變量之間的關(guān)系,揭示其相關(guān)結(jié)構(gòu),利用這種結(jié)構(gòu)建立自回歸、滑動(dòng)平均、自回歸滑動(dòng)平均模型來對時(shí)間序列進(jìn)行預(yù)測。本節(jié)主要采用隨機(jī)性時(shí)間序列分析的自回歸滑動(dòng)平均模型。自回歸滑動(dòng)平均模型ARMA(p,q)是:如果時(shí)間序列Xt(t=1,2,...)是平穩(wěn)的,與前面Xt?1,Xt?2,...Xt?p即(1?Bφ1?B2φ2?...?B隨機(jī)時(shí)間序列的特性分析包含自相關(guān)函數(shù)和偏相關(guān)函數(shù),在使用時(shí),要根據(jù)情況自行選取。在模型識(shí)別與建立時(shí),無論采用自相關(guān)與偏相關(guān)對序列適用的模型類型進(jìn)行識(shí)別,要確定適宜的階數(shù)。而且ARMA(p,q)的自相關(guān)與偏相關(guān)函數(shù)序列的自相關(guān)與偏自相關(guān)函數(shù)均是拖尾的。3.3.2問題分析與模型建立首先,用matlab畫出趨勢圖。從圖中,可以看出:這一時(shí)間序列是非平穩(wěn)的時(shí)間序列(具有明顯趨勢且不含有周期性變化的經(jīng)濟(jì)波動(dòng)序列),對此序列進(jìn)行建模預(yù)測需要使用非平穩(wěn)性時(shí)間序列分析方法。采用模型:Xt=μt+Yt,其中μt表示圖3-4歷年嘉興市利潤總額時(shí)間序列圖確定性趨勢從圖3-4可以看出,當(dāng)去除個(gè)別點(diǎn)后,可以判斷出嘉興市利潤綜合是按指數(shù)趨勢發(fā)展的,因此μt=abt,其中a,b為待定參數(shù)。對指數(shù)曲線線性化,即取對數(shù)為lnμ編寫如下線性回歸分析程序t=2008:2019x=[7759451746017210212238141773981539326018012634190583251787504718750458217049862485800428797137]xx=2008:0.1:2019;%插值yy=interp1(t,x,xx,'cubic');X=[ones(12,1)t'];%回歸的資料矩陣y=log(x)';%線性化[B,BINT,R,RINT,STATS]=regress(y,X)%回歸y2=exp(B(1)+B(2).*t)%預(yù)測值plot(xx,yy,t,y2,'+');%回歸效果圖得到B=[-211.7975,0.1134]STATS=[0.9040,94.1658,0.0000,0.0195]即ln(μt)=-211.7975+畫出用μt=ab圖3-5原始數(shù)據(jù)與指數(shù)回歸數(shù)據(jù)對比圖由上圖可知僅使用指數(shù)回歸的效果較差。隨機(jī)性趨勢作殘差根據(jù)擬合的μ值,這里求出殘差序列Ytr=x-y2;

%殘差數(shù)列

plot(t,r,'o');%殘差散點(diǎn)圖圖3-6殘差序列散點(diǎn)圖從上面散點(diǎn)圖可以看出,該序列波動(dòng)性較大,所以認(rèn)為是非平穩(wěn)的,可以經(jīng)過多次差分使其變得平穩(wěn)。作差分將殘差序列Yt?Yt=Yt-2Yr1=diff(r);%殘差的一階差分r11=[0r1];%補(bǔ)數(shù)列差分后的項(xiàng)為0plot(t,r11,'o');%一階差分散點(diǎn)圖r2=diff(r1);%二階差分r21=[00r2];%補(bǔ)數(shù)列差分后的項(xiàng)為0plot(t,r21,'o');%二階差分散點(diǎn)圖圖3-7一階差分散點(diǎn)圖圖3-8二階差分散點(diǎn)圖將序列{r2t}零均值化,由數(shù)據(jù)求得r2=210270,令wt=rwt序列{wt}的樣本自相關(guān)函數(shù)ρw=r2-mean(

r2

)

;%零均值化

gamao

=var(

w);%求方差

for

j=1

:10

gama(

j)=

w(j+1

:end)

*

w(

1

:end-j)'/10;end

rho

=gama

/gamao%樣本自相關(guān)系數(shù)

bar(rho)%條形圖圖3-9自相關(guān)函數(shù)樣本偏自相關(guān)函數(shù)φkkf(

1,1

)=

rho(

1

);

for

k

=2:10

s1=rho(

k

)

;

s2

=1;%計(jì)算的初始值

for

j=1:k-1

s1=s1-rho(k-j)

*f(k-1,j);

s2=s2-rho(j)

*

f(k-1,j);

end

f(k,k)=

s1/s2;%對角上的樣本偏自相關(guān)系數(shù)

for

j=1:k-1

f(k,j)=

f(k-1,j)-f(k

,

k)

*

f(

k-1,k-j);%不在對角上的樣本偏自相關(guān)系數(shù)

end

end

pcorr

=diag(f)'%提取偏自相關(guān)函數(shù)

bar(pcorr)

%條形圖圖3-10偏自相關(guān)函數(shù)得到的自相關(guān)和偏相關(guān)圖結(jié)果如圖3-9、圖3-10所示,可以看出,ρk隨著k的增大而衰減,有拖尾的現(xiàn)象,而偏自相關(guān)函數(shù)φ模型定階程序:fori=0:3forj=0:3spec=garchset('R',i,'M',j,'Display','off');%指定模型的結(jié)構(gòu)[coeffx,errorsx,LLFX]=garchfit(spec,w);%擬合參數(shù)num=garchcount(coeffx);%計(jì)算擬合參數(shù)的個(gè)數(shù)[aic,bic]=aicbic(LLFX,num,10);fprintf('R=%d,M=%d,AIC=%f,BIC=%f\n',i,j,aic,bic);%顯示計(jì)算結(jié)果endend得到的結(jié)果顯示,可以認(rèn)為是ARMA(0,2)模型。對模型wt=c+εt+spec=garchset('R',0,'M',2,'Display','off');%指定模型的結(jié)構(gòu)[coeffx,errorsx,LLFX]=garchfit(spec,w)%擬合參數(shù)得到最大似然估計(jì)一次運(yùn)行參數(shù)估計(jì)值:c=-1.0517e(-005),ε1=-0.1247,ε所以ARMA(0,2)的模型為wt=-1.0517e(-005)+εt-0.1247ε模型的檢驗(yàn)和預(yù)測程序:spec=garchset('R',0,'M',2);%指定模型的結(jié)構(gòu)[coeff,errors,LLF,innovations,sigmas,summary]=garchfit(spec,w)%擬合參數(shù)h=lbqtest(innovations)%模型檢驗(yàn)[sigmaForecast,x_Forecast]=garchpred(coeff,w,3)%預(yù)測x_pred=x(end)+cumsum(x_Forecast)得到結(jié)果h=0,說明模型是可用的,未來三年wt最終得到預(yù)測結(jié)果圖圖3-11嘉興市的銷售收入預(yù)測的時(shí)間序列圖對比圖3-5和3-11,顯然本模型對于圖像擬合的更好。但是在二階差分后得到的序列仍然是不平穩(wěn)的。對于實(shí)驗(yàn)的準(zhǔn)確性還是有著一定的影響。而且由于實(shí)驗(yàn)數(shù)據(jù)偏少,所以對于實(shí)驗(yàn)的預(yù)測也有著一定影響。

4數(shù)據(jù)可視化展示本論文中使用大數(shù)據(jù)分析軟件-FineBI,去展示嘉興市零售行業(yè)數(shù)據(jù)情況。在FineBI的使用過程中,靈活使用各種組件,對數(shù)據(jù)進(jìn)行智能分析,為企業(yè)領(lǐng)導(dǎo)的決策提供有益的幫助,利用零售行業(yè)的銷售數(shù)據(jù),分析其存在的問題,進(jìn)行監(jiān)測,調(diào)整管理模式,讓零售寒夜實(shí)現(xiàn)更加好的發(fā)展。4.1數(shù)據(jù)可視化原理數(shù)據(jù)可視化是使用圖形化的方法去清晰的傳遞信息的方式。在數(shù)據(jù)可視化的過程中,先要對現(xiàn)有數(shù)據(jù)進(jìn)行分析,得出結(jié)論,并且表達(dá)你所想要闡述的信息和主題。然后使用數(shù)據(jù)可視化工具去制作圖表,滿足你想要表達(dá)的目的。當(dāng)明確了想要闡述的主題和信息后,我們就可以著手選擇合適的圖表了。在以下的圖表制作過程中,我們使用到了折線圖、折線雷達(dá)圖、餅圖、散點(diǎn)圖、對比柱狀圖、分區(qū)折線圖、堆積柱形圖、詞云圖等各類圖形,生動(dòng)清晰的展示了各個(gè)類別的情況,讓我們對于零售行業(yè)的銷售分析與預(yù)測有了新的理解。4.2各類具體情況的分析4.2.1對企業(yè)登記類型分析圖4-1企業(yè)盈虧個(gè)數(shù)情況圖4-2企業(yè)支出情況圖4-3企業(yè)利益來源圖4-4各登記類型企業(yè)收益情況圖4-5各企業(yè)利潤情況圖4-6商品銷售收入和成本對照上圖由六個(gè)子圖組成,分別是企業(yè)盈虧個(gè)數(shù)情況、各登記類型企業(yè)收益情況、各企業(yè)利潤情況、商品銷售收入和成本對照、企業(yè)支出情況、企業(yè)利益來源。盈虧企業(yè)個(gè)數(shù)對比柱狀圖可以清晰的展示各個(gè)企業(yè)類型的盈虧情況,各登記類型企業(yè)收益折線雷達(dá)圖可以生動(dòng)展現(xiàn)流動(dòng)資產(chǎn)、利潤總額、營業(yè)利潤、主營業(yè)務(wù)利潤這四種指標(biāo)再各個(gè)類型企業(yè)所占比重,詞云圖可以直觀表現(xiàn)出私營企業(yè)、外商投資企業(yè)等的發(fā)展?fàn)顩r較好,銷售成本和銷售收入折現(xiàn)圖可以直觀展示各企業(yè)所帶來的收益狀況,企業(yè)利益來源柱狀圖,可以簡單明了的看到企業(yè)的利潤來源所占比重。從上述結(jié)果中,可以得知在各登記類型企業(yè)中,在利潤總額、流動(dòng)資產(chǎn)、營業(yè)利潤、主營業(yè)務(wù)利潤中,流動(dòng)資產(chǎn)的影響較大。私營企業(yè)、港澳臺(tái)商投資其企業(yè)、有限責(zé)任公司、外商投資企業(yè)發(fā)展較好。在支出情況中,經(jīng)營費(fèi)用所花的比重較大。在收益情況中,主營業(yè)務(wù)利潤所占比重較大。這也進(jìn)一步驗(yàn)證了前面3.1.2對企業(yè)類型分類是正確的。4.2.2對主要行業(yè)類型分析圖4-7各行業(yè)主營業(yè)務(wù)利潤情況圖4-8商品銷售成本以及收入圖4-9各個(gè)行業(yè)支出情況圖4-10各個(gè)行業(yè)收益類型圖4-11各個(gè)行業(yè)盈虧企業(yè)個(gè)數(shù)上圖由5個(gè)子圖組成,分別是各行業(yè)主營業(yè)務(wù)利潤、各行業(yè)收益來源、商品銷售成本以及收入、各個(gè)行業(yè)支出情況、各個(gè)行業(yè)盈虧企業(yè)個(gè)數(shù)。從餅圖可以看出燃料及零配件、日用品專門零售業(yè)、綜合零售業(yè)、百貨零售、超級市場零售的主營業(yè)務(wù)發(fā)展較好,散點(diǎn)圖可以直觀看到商品銷售成本和銷售收入的對照情況,從第一個(gè)雷達(dá)圖可以看出再財(cái)務(wù)費(fèi)用、負(fù)債合計(jì)、管理費(fèi)用和經(jīng)營費(fèi)用中的各個(gè)行業(yè)的支出情況,其中負(fù)債合計(jì)較多,從第二個(gè)雷達(dá)圖可以看出再所有者權(quán)益、主營業(yè)務(wù)利潤、資產(chǎn)合計(jì)的各個(gè)行業(yè)的收入占比情況,其中資產(chǎn)合計(jì)較多,對比柱狀圖顏色鮮明的表現(xiàn)各個(gè)行業(yè)的盈虧企業(yè)個(gè)數(shù)。從上圖中,我們可以得知汽車、摩托車、燃料及零配件專門零售業(yè)、綜合零售業(yè)、紡織服裝及日用品專門零售業(yè)、百貨零售、超級市場零售的發(fā)展較好。在支出情況中,總計(jì)負(fù)債的影響較大。在收益情況中,資產(chǎn)合計(jì)的影響較大。4.2.3對零售形態(tài)分析圖4-12商品銷售收入和成本圖4-13各零售形態(tài)資產(chǎn)情況圖4-14零售形態(tài)的利潤情況圖4-15零售形態(tài)企業(yè)盈利情況上圖由6個(gè)子圖組成,分別為商品銷售收入和成本、零售形態(tài)的利潤情況、各銷售形態(tài)資產(chǎn)情況、收益情況、零售形態(tài)企業(yè)盈虧情況、支出情況。折線圖可以直觀展現(xiàn)各個(gè)行業(yè)零售形態(tài)的資產(chǎn)合計(jì)和負(fù)債資產(chǎn)合計(jì)情況,從第一個(gè)雷達(dá)圖可以直觀的在實(shí)收資本、所有者權(quán)益合計(jì)、主營業(yè)務(wù)利潤的各個(gè)零售形態(tài)收益情況的所占比重,從第二個(gè)雷達(dá)圖可以直觀的看到在財(cái)務(wù)費(fèi)用、管理費(fèi)用、經(jīng)營費(fèi)用的各個(gè)零售形態(tài)支出情況所占比重。從詞云圖可以看到有店鋪零售、專賣店零售、專業(yè)店、百貨店等的零售形態(tài)利潤較好,還可以從對比柱狀圖看到零售形態(tài)的企業(yè)盈虧個(gè)數(shù),從堆積柱形圖可以看出資產(chǎn)合計(jì)、負(fù)債合計(jì)指標(biāo)下的各零售形態(tài)資產(chǎn)情況。從中,我們可以得到有店鋪零售、專賣店、專業(yè)店、百貨店、大型超市、無店鋪零售的發(fā)展情況較好。在支出情況當(dāng)中,經(jīng)營費(fèi)用所占比重較大。在收益情況中,所有者權(quán)益影響較大。4.3各個(gè)年份銷售額分析與預(yù)測圖4-16各個(gè)年份主營業(yè)務(wù)利潤情況圖4-17各個(gè)年份銷售收入情況圖4-18各個(gè)年份銷售所占影響因素上圖有三個(gè)子圖,分別為各個(gè)年份主營業(yè)務(wù)利潤情況、各個(gè)年份銷售收入情況、各個(gè)年份銷售所占影響因素。從前兩個(gè)折線圖可以直觀的看到各個(gè)年份主營業(yè)務(wù)利潤趨勢和銷售收入趨勢情況。在各個(gè)年份銷售的影響因素研究當(dāng)中,發(fā)現(xiàn)主營業(yè)務(wù)利潤、經(jīng)營費(fèi)用所占比重較大。各年份銷售收入呈現(xiàn)緩慢曲折上升態(tài)勢,各年份銷售收入也是呈現(xiàn)上升緩慢態(tài)勢。這與主成分分析結(jié)果、時(shí)間序列分析結(jié)果一致,進(jìn)一步驗(yàn)證了該假設(shè)。

結(jié)論在本篇論文中,使用了聚類分析將企業(yè)類型、主要行業(yè)、零售形態(tài)進(jìn)行分類。可以將企業(yè)類型分為兩類,第一類為國有企業(yè)、集體企業(yè)、股份合作企業(yè)、其他企業(yè),數(shù)量少,發(fā)展?fàn)顟B(tài)一般;第二類為外商投資企業(yè)、有限責(zé)任公司、股份有限公司、私營企業(yè)、港澳臺(tái)商投資企業(yè),數(shù)量多,發(fā)展?fàn)顟B(tài)良好。從中可以看出,政府可以加強(qiáng)對于第一類企業(yè)的管理,提高企業(yè)效率,并且極大鼓勵(lì)第二類企業(yè)向好的事態(tài)發(fā)展??梢詫⒅饕袠I(yè)分為兩類:第一類食品、飲料及煙草專門零售業(yè),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論