




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)是一門關(guān)于使用科學(xué)的方法收集、整理、匯總、描述和分析數(shù)據(jù)資料,并在此基礎(chǔ)上進(jìn)行推斷和決策的技術(shù),其關(guān)鍵在于對(duì)數(shù)據(jù)的分析與加工。統(tǒng)計(jì)在日常生活和各類職業(yè)中有著廣泛的應(yīng)用,例如:在社會(huì)學(xué)領(lǐng)域,需要調(diào)查青年對(duì)婚姻家庭、經(jīng)濟(jì)收入、相貌等因素的態(tài)度,以便進(jìn)行正確引導(dǎo);在康復(fù)醫(yī)療領(lǐng)域,需要對(duì)患有抑郁癥的病人,按照測(cè)量得到的指標(biāo),進(jìn)行恰當(dāng)?shù)臍w類,以便進(jìn)行有針對(duì)性的治療;在經(jīng)濟(jì)活動(dòng)中,需要考慮商品的市場(chǎng)反應(yīng)與價(jià)格、消費(fèi)者收入和廣告等因素之間的相互關(guān)系,以及建立數(shù)學(xué)模型進(jìn)行預(yù)測(cè)等問(wèn)題。
本章將主要介紹描述性統(tǒng)計(jì)、單因素方差分析、相關(guān)分析、回歸分析與時(shí)間序列分析等內(nèi)容,并借助Excel工具進(jìn)行統(tǒng)計(jì)分析。通過(guò)這些內(nèi)容的學(xué)習(xí),你將了解統(tǒng)計(jì)是如何被應(yīng)用到與我們有著密切聯(lián)系的各個(gè)領(lǐng)域的。.引
言
第一節(jié)
描述性統(tǒng)計(jì)分析01第一節(jié)
描述性統(tǒng)計(jì)分析總體:研究對(duì)象的某一個(gè)(或多個(gè))指標(biāo)全體。個(gè)體:組成總體的每一個(gè)單元??傮w容量:總體中所包含個(gè)體的總數(shù)。
樣本:在總體中隨機(jī)地抽取
個(gè)個(gè)體,記其指標(biāo)值為樣品:樣本中的個(gè)體。樣本容量:樣本中所包含個(gè)體總數(shù)
。
例:對(duì)于某一個(gè)地區(qū)而言,我們往往很難得到全體男性成人的身高與體重,只能抽取個(gè)男性成人進(jìn)行測(cè)量,根據(jù)測(cè)量結(jié)果來(lái)推斷和的分布情況,則該地區(qū)全部男性成人的身高與體重是一個(gè)總體,而其中每一個(gè)男性成人的身高與體重是一個(gè)個(gè)體,所抽取的個(gè)男性成人的身高和體重
是一個(gè)個(gè)樣本。1.1重要統(tǒng)計(jì)概念第一節(jié)
描述性統(tǒng)計(jì)分析
描述性統(tǒng)計(jì)分析:通過(guò)圖表或數(shù)學(xué)方法,對(duì)數(shù)據(jù)資料進(jìn)行整理、分析,并對(duì)數(shù)據(jù)的分布狀態(tài)、數(shù)字特征和隨機(jī)變量之間的關(guān)系進(jìn)行估計(jì)和描述的方法。簡(jiǎn)單隨機(jī)樣本:用簡(jiǎn)單隨機(jī)抽樣方法得到的樣本。
注意:最常用的“簡(jiǎn)單隨機(jī)抽樣”有如下兩個(gè)要求:(1)樣本具有隨機(jī)性,即要求總體中每一個(gè)個(gè)體都有同等機(jī)會(huì)被選入樣本,這便意味著每一個(gè)樣品與總體有相同的分布。(2)樣本要有獨(dú)立性,即要求樣本中每一個(gè)樣品的取值不影響其他樣品的取值,這意味著相互獨(dú)立。第一節(jié)描述性統(tǒng)計(jì)分析
用圖描述數(shù)據(jù)
把樣本數(shù)據(jù)轉(zhuǎn)化為對(duì)應(yīng)的統(tǒng)計(jì)圖,通過(guò)統(tǒng)計(jì)圖直觀地描述數(shù)據(jù)的分布。用統(tǒng)計(jì)量描述數(shù)據(jù)
針對(duì)不同的問(wèn)題構(gòu)造出樣本的某種函數(shù),這種函數(shù)就是統(tǒng)計(jì)量,利用統(tǒng)計(jì)量描述觀測(cè)數(shù)據(jù)的集中、分散等情況。
描述性統(tǒng)計(jì):包括統(tǒng)計(jì)數(shù)據(jù)的收集方法、數(shù)據(jù)的加工處理方法、數(shù)據(jù)的顯示方法、數(shù)據(jù)分布特征的概括與分析方法等。第一節(jié)描述性統(tǒng)計(jì)分析例1某車間加工裝配一種金屬制品,產(chǎn)品在裝配線上的一道關(guān)鍵工序所需要的時(shí)間是該裝配線工作效率的一個(gè)重要指標(biāo).為了了解具體情況,從中抽取100個(gè)樣品,其測(cè)量數(shù)據(jù)(單位:秒)見(jiàn)表3-1。試?yán)L制頻數(shù)分布直方圖和頻率分布直方圖,并描述該直方圖。用直方圖描述區(qū)間數(shù)據(jù)51.756.954.553.953.753.953.153.154.553.950.651.955.353.553.153.152.953.354.355.757.952.154.953.354.553.353.155.155.555.956.955.154.353.953.955.354.354.755.753.756.754.953.753.556.755.753.154.955.553.556.754.753.553.554.556.152.754.354.953.155.355.353.752.554.354.753.153.955.352.356.155.353.153.355.153.153.353.755.552.753.754.554.553.554.153.353.153.953.752.954.554.953.153.354.552.753.353.554.153.3表3-1關(guān)鍵工序所需時(shí)間表1.2用圖描述數(shù)據(jù)
第一節(jié)描述性統(tǒng)計(jì)分析解繪制頻數(shù)分布直方圖和頻率分布直方圖一般分為以下四個(gè)步驟。第一步:計(jì)算極差,即樣本數(shù)據(jù)最大值與最小值的差。在表3-1的數(shù)據(jù)中,最小值是50.6秒,最大值是57.9秒,極差是7.3秒,說(shuō)明關(guān)鍵工序的裝配時(shí)間變化范圍是7.3秒。
第一節(jié)描述性統(tǒng)計(jì)分析第三步:列頻數(shù)分布和頻率分布表。對(duì)落在各小組內(nèi)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),得到各小組內(nèi)數(shù)據(jù)的頻數(shù)和頻率,見(jiàn)表3-2。第四步:繪制頻數(shù)分布直方圖和頻率分布直方圖。根據(jù)表3-2,畫出頻數(shù)分布直方圖(如圖3-1所示)和頻率分布直方圖(如圖3-2所示)..圖3-1
頻數(shù)分布直方圖
圖3-2頻率分布直方圖表3-2頻數(shù)分布和頻率分布表時(shí)間分組頻數(shù)頻率x≤52.140.0452.1<x≤53.6350.3553.6<x≤55.1400.4055.1<x≤56.6150.15x>56.660.06
第一節(jié)描述性統(tǒng)計(jì)分析在圖3-1中,橫軸表示時(shí)間,縱軸表示頻數(shù)與組距的比值。容易看出:
可見(jiàn),頻數(shù)分布直方圖是以小長(zhǎng)方形的面積來(lái)反映數(shù)據(jù)落在各小組內(nèi)的頻數(shù)的大小。同理,圖3-2中小長(zhǎng)方形的面積反映數(shù)據(jù)落在各小組內(nèi)的頻率的大小。圖3-1
頻數(shù)分布直方圖
圖3-2頻率分布直方圖第一節(jié)描述性統(tǒng)計(jì)分析基于下列特征來(lái)描述直方圖的輪廓:
(1)對(duì)稱性
由直方圖的中心畫一條垂直于橫軸的直線,兩邊的形狀和大小相同時(shí),則其直方圖被稱為是對(duì)稱的,如圖3-3(1)所示。
(2)偏態(tài)
一個(gè)偏態(tài)的直方圖是指具有一條延伸向右或向左的長(zhǎng)尾,前者稱為正偏
態(tài),如圖3-3(2)所示,后者稱為負(fù)偏態(tài),如圖3-3(3)所示。圖3-3(1)圖3-3(2)圖3-3(3)第一節(jié)描述性統(tǒng)計(jì)分析
(3)眾數(shù)組個(gè)數(shù)眾數(shù)是指發(fā)生最多次數(shù)的觀測(cè)值,而眾數(shù)組則為一個(gè)具有最多觀測(cè)值個(gè)數(shù)的小組。具有單一高峰者(眾數(shù)組只有1個(gè))稱為單峰直方圖,如圖3-4(1)所示。(4)鐘形
對(duì)稱單峰直方圖稱為鐘形。
鐘形直方圖對(duì)應(yīng)的數(shù)據(jù)一般服從正態(tài)分布,而正態(tài)分布是概率與統(tǒng)計(jì)中最重要的一種分布,如圖3-4(2)所示。圖3-4(1)圖3-4(2)第一節(jié)描述性統(tǒng)計(jì)分析
例2某電纜廠有兩臺(tái)生產(chǎn)設(shè)備(A、B),最近,經(jīng)常有不符合規(guī)格值(克)的異常產(chǎn)品發(fā)生?,F(xiàn)就A、B兩臺(tái)設(shè)備分別測(cè)量了50個(gè)產(chǎn)品,數(shù)據(jù)見(jiàn)表3-3。
試分別畫出它們的頻數(shù)分布直方圖并分析由直方圖所得的結(jié)論。A設(shè)備B設(shè)備120179168165183156148165152161168188184170172167150150136123169182177186150161162170139162179160185180163132119157157163187169194178176157158165164173173177167166179150166144157162176183163175161172170137169153167174172184188177155160152156154173171162167160151163158146165169176155170153142169148155表3-3兩臺(tái)設(shè)備生產(chǎn)的產(chǎn)品規(guī)格值第一節(jié)描述性統(tǒng)計(jì)分析圖3-5(1)A設(shè)備圖3-5(2)B設(shè)備比較這兩個(gè)直方圖,不難得到以下信息:(1)A設(shè)備的產(chǎn)品規(guī)格值直方圖的中心高于B設(shè)備的產(chǎn)品規(guī)格值直方圖的中心;(2)兩個(gè)直方圖都呈現(xiàn)稍微的負(fù)偏態(tài)。
若產(chǎn)品規(guī)格值低于135克為不合格產(chǎn)品,則B設(shè)備產(chǎn)品異常的可能性更大;如果產(chǎn)品規(guī)格值越高,產(chǎn)品質(zhì)量越好,則A設(shè)備的產(chǎn)品的質(zhì)量會(huì)高于B設(shè)備。解:分別就A、B兩臺(tái)設(shè)備繪制出它們的產(chǎn)品規(guī)格值頻數(shù)分布直方圖,如圖3-5所示。第一節(jié)描述性統(tǒng)計(jì)分析
對(duì)名目數(shù)據(jù)唯一被允許的計(jì)算是統(tǒng)計(jì)隨機(jī)變量的每一個(gè)可能值出現(xiàn)的次數(shù),進(jìn)一步借助條形圖或餅圖來(lái)描述統(tǒng)計(jì)結(jié)果。用條形圖和餅圖描述名目數(shù)據(jù)
例3一所大學(xué)的學(xué)生就業(yè)指導(dǎo)中心對(duì)去年商學(xué)院的畢業(yè)生進(jìn)行一項(xiàng)調(diào)查,以了解其找到的工作的一般領(lǐng)域。就業(yè)的領(lǐng)域有會(huì)計(jì)、財(cái)務(wù)、一般管理、銷售、其他,資料被分別以數(shù)字1、2、3、4、5來(lái)表示,已整理好的數(shù)據(jù)見(jiàn)表3-4。試?yán)L制相應(yīng)的條形圖和餅圖以描述這一組名目數(shù)據(jù)。領(lǐng)域畢業(yè)生數(shù)畢業(yè)生比例會(huì)計(jì)7328.9%財(cái)務(wù)5220.6%一般管理3614.2%銷售6425.3%其他2811.1%合計(jì)253100%表3-4學(xué)生就業(yè)領(lǐng)域統(tǒng)計(jì)表第一節(jié)描述性統(tǒng)計(jì)分析解:條形圖由繪制出代表每一個(gè)類別的長(zhǎng)方形構(gòu)成,長(zhǎng)方形的高代表次數(shù),底則為任意決定的。圖3-6為表3-5對(duì)應(yīng)的條形圖。圖3-6畢業(yè)生就業(yè)領(lǐng)域條形圖圖3-7畢業(yè)生就業(yè)領(lǐng)域餅圖
第一節(jié)描述性統(tǒng)計(jì)分析用散點(diǎn)圖描述兩變量的關(guān)系
在統(tǒng)計(jì)中,我們常常需要知道兩個(gè)隨機(jī)變量之間是否存在某種關(guān)聯(lián)。一種描述兩個(gè)隨機(jī)變量間關(guān)系的方法稱為散點(diǎn)圖。為了繪制一個(gè)散點(diǎn)圖,我們需要兩個(gè)隨機(jī)變量的數(shù)據(jù)。應(yīng)用上,當(dāng)一個(gè)隨機(jī)變量某種程度上依賴于另一個(gè)隨機(jī)變量時(shí),我們分別用X和Y表示。第一節(jié)描述性統(tǒng)計(jì)分析例4某大型牙膏制造企業(yè)為了更好地拓展產(chǎn)品市場(chǎng),公司董事會(huì)要求銷售部根據(jù)市場(chǎng)調(diào)查,找出公司生產(chǎn)的牙膏銷售量與廣告投入之間的關(guān)系,從而預(yù)測(cè)出不同廣告費(fèi)用下的銷售量。為此,銷售部的研究人員收集了過(guò)去30個(gè)銷售周期(每個(gè)銷售周期為4周)公司生產(chǎn)的牙膏的銷售量和投入的廣告費(fèi)用,見(jiàn)表3-5。試根據(jù)這些數(shù)據(jù),用統(tǒng)計(jì)圖的方法描述牙膏銷售量與廣告投入之間的關(guān)系。銷售周期廣告費(fèi)用(百萬(wàn)元)銷售量(百萬(wàn)支)銷售周期廣告費(fèi)用(百萬(wàn)元)銷售量(百萬(wàn)支)銷售周期廣告費(fèi)用(百萬(wàn)元)銷售量(百萬(wàn)支)15.57.38116.57.89216.257.6526.758.51126.258.152267.2737.259.521379.1236.5845.57.5146.98.862478.5579.33156.88.9256.88.7566.58.28166.88.87266.89.2176.758.75177.19.26276.58.2785.257.871879286.757.6795.257.1196.88.75295.87.931068206.57.95306.89.26表3-5牙膏銷售量與廣告費(fèi)用數(shù)據(jù)第一節(jié)描述性統(tǒng)計(jì)分析散點(diǎn)圖顯示,一般而言,廣告費(fèi)用越高,其銷售量也就越高,并且銷售量可近似地看成隨著廣告費(fèi)用的增加而成線性增加趨勢(shì)。圖3-8銷售量現(xiàn)對(duì)于廣告費(fèi)用散點(diǎn)圖解:設(shè)縱坐標(biāo)Y表示牙膏的銷售量,橫坐標(biāo)X表示廣告費(fèi)用,繪制散點(diǎn)圖如圖3-8所示。第一節(jié)描述性統(tǒng)計(jì)分析用折線圖描述時(shí)間序列數(shù)據(jù)
時(shí)間序列數(shù)據(jù)常用折線圖來(lái)描述,即以橫軸為時(shí)間軸,縱軸為對(duì)應(yīng)時(shí)間點(diǎn)隨機(jī)變量的觀測(cè)值,將統(tǒng)計(jì)數(shù)據(jù)用對(duì)應(yīng)于平面內(nèi)的點(diǎn)表示,相鄰兩點(diǎn)用一條線段連接,形成點(diǎn)劃線。第一節(jié)描述性統(tǒng)計(jì)分析
例5
已知某商場(chǎng)1978—1998年的年銷售額見(jiàn)表3-6,試?yán)L制這些數(shù)據(jù)的折線圖并描述其所包含的信息。年份銷售額(萬(wàn)元)年份銷售額(萬(wàn)元)年份銷售額(萬(wàn)元)19783219856419928419794119866919938619804819876719948719815319886919959219825119897619969519835819907319971011984571991791998107表3-6某商場(chǎng)1978-1998年的年銷售額第一節(jié)描述性統(tǒng)計(jì)分析
結(jié)合圖3-10不難發(fā)現(xiàn),該商場(chǎng)的銷售額保持基本一致的增長(zhǎng)趨勢(shì),統(tǒng)計(jì)的前4年保持了較快的增長(zhǎng)速度,然后出現(xiàn)了10年的小幅波動(dòng)中增長(zhǎng),1990年以后保持了平穩(wěn)的增長(zhǎng)趨勢(shì)。這可能跟公司的發(fā)展與經(jīng)營(yíng)政策的改變有密切聯(lián)系。解:1978-1998年的年銷售額隨著年份的變化的折線圖如圖3-10所示。圖3-10商場(chǎng)銷售額時(shí)間序列圖第一節(jié)描述性統(tǒng)計(jì)分析
統(tǒng)計(jì)量:統(tǒng)計(jì)理論中用來(lái)對(duì)數(shù)據(jù)進(jìn)行分析、檢驗(yàn)的變量。中心趨勢(shì):又稱定位度量或者平均數(shù),是一組數(shù)據(jù)典型的或者有代表意義的值。離散趨勢(shì):對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)描述還需要知道數(shù)據(jù)圍繞中心點(diǎn)是如何分散的,稱之為離散趨勢(shì)。
分布形狀:隨機(jī)變量的分布形狀主要包括偏度和峰度。1.3常用統(tǒng)計(jì)量第一節(jié)描述性統(tǒng)計(jì)分析
幾何平均數(shù):度量平均值的另一種方法,特別是在計(jì)算平均增長(zhǎng)率、平均收益率時(shí)經(jīng)常被使用。設(shè)
表示第期的投資回報(bào)率,則投資回報(bào)率的幾何平均數(shù)定義為
中心趨勢(shì)第一節(jié)描述性統(tǒng)計(jì)分析
眾數(shù):樣本觀測(cè)值中發(fā)生次數(shù)最多的觀測(cè)值。使用眾數(shù)作為中心趨勢(shì)統(tǒng)計(jì)量,會(huì)有兩個(gè)問(wèn)題:第一,在一個(gè)小樣本內(nèi),它可能不是一個(gè)很好的觀測(cè)值;第二,它可能不唯一。
中位數(shù):把所有觀測(cè)值依序排列(遞增或遞減),位于最中間的觀測(cè)值就是中位數(shù)。當(dāng)觀測(cè)值個(gè)數(shù)為偶數(shù)時(shí),則中位數(shù)是位于中間的兩個(gè)觀測(cè)值的平均數(shù)。
中心趨勢(shì)第一節(jié)描述性統(tǒng)計(jì)分析離散趨勢(shì)
極差:樣本最大觀測(cè)值和最小觀測(cè)值之間的差。
極差:樣本方差的算術(shù)平方根,即
方差系數(shù):樣本觀測(cè)值的標(biāo)準(zhǔn)差除以樣本均值的結(jié)果,即
第一節(jié)描述性統(tǒng)計(jì)分析
例6
表3-7給出了東風(fēng)汽車和上海機(jī)場(chǎng)兩只股票在12個(gè)交易日的價(jià)格,試比較兩只股票價(jià)格在這12個(gè)交易日內(nèi)的活躍程度。日期東風(fēng)汽車上海機(jī)場(chǎng)日期東風(fēng)汽車上海機(jī)場(chǎng)200503103.1716.06200503182.9716.52200503113.1616.55200503212.9416.65200503143.1017.27200503222.71171016.82200503232.7416.90200503163.0916.60200503242.7616.86200503173.0216.65200503252.7516.79表3-7兩只股票12個(gè)交易日的價(jià)格表第一節(jié)描述性統(tǒng)計(jì)分析解:分別計(jì)算兩組樣本均值、樣本標(biāo)準(zhǔn)差和方差系數(shù),得東風(fēng)汽車:均值為2.96,標(biāo)準(zhǔn)差為0.176,方差系數(shù)為0.059。上海機(jī)場(chǎng):均值為16.74,標(biāo)準(zhǔn)差為0.316,方差系數(shù)為0.019。
如果從標(biāo)準(zhǔn)差來(lái)看,上海機(jī)場(chǎng)的股票活躍程度要大于東風(fēng)汽車,但從方差系數(shù)來(lái)看,上海機(jī)場(chǎng)的方差系數(shù)僅為0.019,遠(yuǎn)小于東風(fēng)汽車的0.059。兩者存在矛盾是因?yàn)樯虾C(jī)場(chǎng)的股價(jià)要高于東風(fēng)汽車,所以含有量綱的標(biāo)準(zhǔn)差就會(huì)偏高,而采用方差系數(shù)考慮了股價(jià)的均值,能更好地反映股價(jià)的活躍程度,因此可以從方差系數(shù)作出判斷,即東風(fēng)汽車股價(jià)的活躍度高于上海機(jī)場(chǎng)股價(jià)的活躍度。第一節(jié)描述性統(tǒng)計(jì)分析分布形狀
若sk<0,則分布具有負(fù)偏態(tài)若sk>0,則分布具有正偏態(tài)若sk接近0,則分布是對(duì)稱的第一節(jié)描述性統(tǒng)計(jì)分析分布形狀
若bk<0,則表示峰度比正態(tài)分布平坦若bk>0,則表示峰度比正態(tài)分布陡峭若bk=0,則表示峰度與正態(tài)分布相同第一節(jié)描述性統(tǒng)計(jì)分析
例7表3-8給出了某股票在18個(gè)交易日的價(jià)格,試求該股票價(jià)格的偏度和峰度。日期價(jià)格日期價(jià)格日期價(jià)格200503106.4200503186.29200503285.97200503116.38200503216.16200503295.93200503146.44200503226.12200503305.94200503156.36200503236.08200503315.54200503166.24200503245.99200504015.36200503176.35200503255.93200504045.4表3-8某股票18個(gè)交易日的價(jià)格表
解:數(shù)據(jù)的偏度和峰度的計(jì)算公式較為復(fù)雜,我們可以借助Excel輔助算。其中,偏度的Excel指令是“=SKEW(數(shù)據(jù)對(duì)象)”,峰度的Excel指令“=KURT(數(shù)據(jù)對(duì)象)”。借助Excel求解,可得該股票價(jià)格的偏度sk=-0.9236,峰度bk=0.0687。這說(shuō)明股票價(jià)格呈負(fù)偏態(tài);峰度值接近于0,其陡峭程度與正態(tài)分布接近。
第二節(jié)
相關(guān)分析與線性回歸02第二節(jié)相關(guān)分析與線性回歸相關(guān)關(guān)系:現(xiàn)象之間確實(shí)存在某種聯(lián)系,但數(shù)量關(guān)系表現(xiàn)為不嚴(yán)格的相互依存關(guān)系.即對(duì)一個(gè)變量或幾個(gè)變量為一定值時(shí),另一變量值表現(xiàn)為在一定范圍內(nèi)的隨機(jī)波動(dòng),具有非確定性。
一般地,客觀現(xiàn)象之間的數(shù)量關(guān)系表現(xiàn)為兩大類型:函數(shù)關(guān)系與相關(guān)關(guān)系。函數(shù)關(guān)系:反映現(xiàn)象之間存在嚴(yán)格的依存關(guān)系,在這種關(guān)系中,對(duì)于某一變量的一個(gè)數(shù)值,都有另一變量的確定的值與之對(duì)應(yīng)。相關(guān)分析第二節(jié)相關(guān)分析與線性回歸
相關(guān)的種類:根據(jù)自變量的多少劃分,可分為單相關(guān)和復(fù)相關(guān)。
根據(jù)相關(guān)關(guān)系的方向劃分,可分為正相關(guān)和負(fù)相關(guān)。
根據(jù)變量間相互關(guān)系的表現(xiàn)形式劃分,線性相關(guān)和非線性相關(guān)。
根據(jù)相關(guān)關(guān)系的程度劃分,可分為不相關(guān)、完全相關(guān)和不完全相關(guān)。
第二節(jié)相關(guān)分析與線性回歸
線性相關(guān)的測(cè)定:
樣本相關(guān)系數(shù)的計(jì)算公式為:
上式也可變形為:
第二節(jié)相關(guān)分析與線性回歸
解:根據(jù)相關(guān)系數(shù)計(jì)算公式,可得說(shuō)明產(chǎn)品銷售額與利潤(rùn)額存在高度正相關(guān).可通過(guò)EXCEL的函數(shù)CORREL求相關(guān)系數(shù),基本調(diào)用格式是:
其中:Array1為第一組數(shù)值單元格區(qū)域,Array2為第二組數(shù)值單元格區(qū)域.第二節(jié)相關(guān)分析與線性回歸
相關(guān)系數(shù)的幾個(gè)簡(jiǎn)單性質(zhì):(1)相關(guān)系數(shù)的取值范圍為r≤1。
(2)若0<r≤1,表明x與y之間存在正線性相關(guān)關(guān)系;若-1≤r<0,表明x與y之間存在負(fù)線性相關(guān)關(guān)系。(3)當(dāng)r≥0.8時(shí),可視狓與狔之間高度相關(guān);當(dāng)0.5≤r<0.8時(shí),可視x與y之間中度相關(guān);當(dāng)0.3≤r<0.5時(shí),可視x與y之間低度相關(guān);當(dāng)r<0.3時(shí),說(shuō)明x與y之間的相關(guān)程度極弱,可視為非線性相關(guān)。
(4)若r=±1,則x與y之間存在確定的函數(shù)關(guān)系。
第二節(jié)相關(guān)分析與線性回歸線性回歸回歸分析:回歸分析是通過(guò)規(guī)定因變量和自變量來(lái)確定變量之間的因果關(guān)系,建立回歸模型,并根據(jù)實(shí)測(cè)數(shù)據(jù)來(lái)求解模型的各個(gè)參數(shù),然后評(píng)價(jià)回歸模型能否很好地?cái)M合實(shí)測(cè)數(shù)據(jù)。第二節(jié)相關(guān)分析與線性回歸(1)根據(jù)自變量的個(gè)數(shù),可分為一元回歸與多元回歸。一元回歸:只有一個(gè)自變量,又稱為簡(jiǎn)單回歸。多元回歸:含有兩個(gè)或兩個(gè)以上的自變量,又稱為復(fù)回歸?;貧w的種類:(2)根據(jù)回歸的表現(xiàn)形式,可分為線性回歸與非線性回歸。線性回歸:回歸方程的因變量是自變量的一次函數(shù)形式,回歸線在直角坐標(biāo)系下表現(xiàn)為一條直線。非線性回歸:回歸方程的因變量不是自變量的一次函數(shù)形式,回歸線在直角坐標(biāo)系下表現(xiàn)為曲線形狀。非線性回歸的方程可以是二次或二次以上函數(shù)、指數(shù)函數(shù)和對(duì)數(shù)函數(shù)等初等函數(shù)的形式。
第二節(jié)相關(guān)分析與線性回歸一元線性回歸
第二節(jié)相關(guān)分析與線性回歸例2
從我校學(xué)生中隨機(jī)選取8名女大學(xué)生,其身高和體重?cái)?shù)據(jù)見(jiàn)表3-9。
編號(hào)12345678身高/cm150152157160162165168170體重/kg4350485761545964表3-9隨機(jī)選取的8名女大學(xué)生身高與體重?cái)?shù)據(jù)試求根據(jù)女大學(xué)生的身高預(yù)報(bào)體重的回歸方程,并預(yù)報(bào)身高為172厘米的女大學(xué)生的體重。第二節(jié)相關(guān)分析與線性回歸解:由于問(wèn)題中要求根據(jù)身高預(yù)報(bào)體重,因此選取身高為自變量,體重為因變量,設(shè)一元線性回歸方程為:
其中,分別是的估計(jì)值.當(dāng)變量取時(shí),可以得到
,它與實(shí)際體重之間的偏差是(如圖3-13所示):若記則問(wèn)題轉(zhuǎn)化為:當(dāng)
取什么值時(shí)使值最小,即總體偏差小。也可以理解為確定回歸直線,使得樣本數(shù)據(jù)的點(diǎn)到它的距離的平方小。這一方法叫做最小二乘法。第二節(jié)相關(guān)分析與線性回歸據(jù)最小二乘法的思想和數(shù)學(xué)推導(dǎo),可得回歸系數(shù)在本例中,因此于是,得到回歸方程據(jù)此可以預(yù)測(cè),對(duì)于身高172厘米的女大學(xué)生,其體重的估計(jì)值為顯然,身高172厘米的女大學(xué)生的體重不一定是64.357千克,但一般可以認(rèn)為她的體重接近于64.357千克,圖3-13中的樣本點(diǎn)和回歸直線的相互位置說(shuō)明了這一點(diǎn)。
第二節(jié)相關(guān)分析與線性回歸
圖3-13預(yù)報(bào)體重與實(shí)際體重之間的偏差第二節(jié)相關(guān)分析與線性回歸在實(shí)際應(yīng)用中,通過(guò)回歸方程得到的預(yù)報(bào)值與實(shí)測(cè)值之間會(huì)有誤差,該誤差的產(chǎn)生可歸結(jié)為以下兩個(gè)原因:(1)預(yù)報(bào)值與實(shí)測(cè)值之間會(huì)產(chǎn)生一個(gè)隨機(jī)誤差。(2)根據(jù)回歸系數(shù)公式得到的估計(jì)值與真實(shí)值之間也存在誤差。根據(jù)EXCEL求解結(jié)果分析回歸模型的有效性:單擊“數(shù)據(jù)”中的“數(shù)據(jù)分析”選項(xiàng),選中“回歸”,按要求輸入數(shù)據(jù),選擇求解參數(shù)(置信度定為95%)回歸系數(shù)估計(jì)值置信區(qū)間-83.0714[-161.3310,-4.8118]0.8571[0.3699,1.3443]r=0.8692,R2=0.7554,SignificanceF=0.0051第二節(jié)相關(guān)分析與線性回歸
表3-10顯示,相關(guān)系數(shù),說(shuō)明身高與體重呈高度線性相關(guān)。表示身高變量對(duì)于體重變量變化的貢獻(xiàn)率,越接近于1,表示回歸的效果越好。在例9中,,表明“女大學(xué)生的身高解釋了75.54%的體重變化”,或者說(shuō)“女大學(xué)生的體重差異有64%是由身高引起的”。Significance
F對(duì)應(yīng)的是在顯著性水平下的模型棄真概率,即模型為不可靠的概率.顯然,
Significance
F的值越小越好,對(duì)于例9,其值為0.0051,故置信度達(dá)到99.49%。表3-10不僅給出了回歸系數(shù)的估計(jì)值,還給出了回歸系數(shù)的置信度為95%的置信區(qū)間,即我們可以有95%的把握保證回歸系數(shù)第二節(jié)相關(guān)分析與線性回歸
例3某大型牙膏制造企業(yè)為了更好地拓展產(chǎn)品市場(chǎng),有效地管理庫(kù)存,公司董事會(huì)要求銷售部根據(jù)市場(chǎng)調(diào)查,找出公司生產(chǎn)的牙膏銷售量與銷售價(jià)格、廣告投入等之間的關(guān)系,從而預(yù)測(cè)出在不同價(jià)格和廣告費(fèi)用下的銷售量.為此,銷售部的研究人員收集了過(guò)去30個(gè)銷售周期(每個(gè)銷售周期為4周)公司生產(chǎn)的牙膏的銷售量、銷售價(jià)格、投入的廣告費(fèi)用,以及同期其他廠家生產(chǎn)的同類牙膏的市場(chǎng)平均銷售價(jià)格,見(jiàn)表3-11。試根據(jù)這些數(shù)據(jù),分析牙膏銷售量與這些因素之間的關(guān)系,為制定價(jià)格策略和廣告投入策略提供數(shù)量依據(jù)。多元線性回歸多元線性回歸:在線性回歸分析中,如果有兩個(gè)或兩個(gè)以上的自變量。第二節(jié)相關(guān)分析與線性回歸銷售周期公司銷售價(jià)格其他廠家平均價(jià)格(元)廣告費(fèi)用(百萬(wàn)元)價(jià)格差(元)銷售量(百萬(wàn)支)13.853.805.50-0.057.3823.754.006.750.258.5133.704.307.250.609.5243.703.705.500.007.5053.603.857.000.259.3363.603.806.500.208.2873.603.756.750.158.7583.803.855.250.057.8793.803.655.25-0.157.10103.854.006.000.158.00113.904.106.500.207.89123.904.006.250.108.15133.704.107.000.409.10143.754.206.900.458.86153.754.106.800.358.90163.804.106.800.308.87173.704.207.100.509.26183.804.307.000.509.00193.704.106.800.408.75203.803.756.50-0.057.95213.803.756.25-0.057.65223.753.656.00-0.107.27233.703.906.500.208.00243.553.657.000.108.50253.604.106.800.508.75263.654.256.800.609.21273.703.656.50-0.058.27283.753.756.750.007.67293.803.855.800.057.93303.704.256.800.559.26表3-11牙膏銷售量與銷售價(jià)格、廣告費(fèi)用等數(shù)據(jù)第二節(jié)相關(guān)分析與線性回歸問(wèn)題分析:由于牙膏是生活必需品,對(duì)大多數(shù)顧客來(lái)說(shuō),在購(gòu)買同類產(chǎn)品的牙膏時(shí)更多地會(huì)在意不同品牌之間的價(jià)格差異,而不是它們的價(jià)格本身,因此,在研究各個(gè)因素對(duì)銷售量的影響時(shí),用價(jià)格差代替公司銷售價(jià)格和其他廠家平均價(jià)格更為合適。解:記牙膏銷售量為,其他廠家平均價(jià)格與公司銷售價(jià)格之差(價(jià)格差)為,公司投入的廣告費(fèi)用為,為了大致地分析與及的關(guān)系,首先利用表3-11的數(shù)據(jù)分別作出
對(duì)及的散點(diǎn)圖,如圖3-14和3-15所示。第二節(jié)相關(guān)分析與線性回歸圖3-13銷售量對(duì)價(jià)格散點(diǎn)圖
圖3-14銷售量對(duì)廣告費(fèi)用散點(diǎn)圖從圖3-14及圖3-15可以發(fā)現(xiàn),隨著、的增加,的值有比較明顯的線性增長(zhǎng)趨勢(shì),可用線性回歸模型來(lái)擬合銷售量與廣告費(fèi)用及價(jià)格差二者之間的數(shù)量關(guān)系。第二節(jié)相關(guān)分析與線性回歸
借助Excel回歸分析工具,得到回歸分析結(jié)果如表3-12所示?;貧w系數(shù)估計(jì)值置信區(qū)間4.8469[3.2986,6.3951]1.8061[1.1860,2.4261]0.4857[0.2332,0.7382]r=0.9316,R2=0.8678,SignificanceF=1.37×10-12
根據(jù)表3-12的結(jié)果,得回歸方程模型為表3-12
例10的Excel求解結(jié)果第二節(jié)相關(guān)分析與線性回歸v
相關(guān)系數(shù)=0.9316,說(shuō)明牙膏銷售量與價(jià)格差、廣告費(fèi)用呈高度線性相關(guān)。
表明“價(jià)格差和廣告費(fèi)用兩個(gè)因素解釋了86.78%的銷售量的變化”。
SignificanceF的值為,故置信度幾乎達(dá)到100%?;貧w系數(shù)的置信度為95%的置信區(qū)間分別為
第三節(jié)
時(shí)間序列分析03第三節(jié)時(shí)間序列分析時(shí)間序列:反映客觀現(xiàn)象的同一指標(biāo)在不同時(shí)間上的數(shù)值按時(shí)間先后順序排列而形成的序列。3.1
時(shí)間序列的概念時(shí)間順序指標(biāo)數(shù)值表3-13時(shí)間序列的一般形式第三節(jié)時(shí)間序列分析年份(年)國(guó)內(nèi)生產(chǎn)總值(億元)第一產(chǎn)業(yè)增加值比重(%)年末人口總數(shù)(萬(wàn)人)年均國(guó)內(nèi)生產(chǎn)總值(元∕人)199558478.120.511211214584199667884.620.391223895576199774462.619.091236266054199878345.218.571247616308199982067.517.631257866551200089468.116.351267437086200197314.815.8412762776512002105172.315.3212845382142003117390.214.4212922791112004136875.915.1712998810561表3-14國(guó)內(nèi)生產(chǎn)總值及其部分構(gòu)成統(tǒng)計(jì)表第三節(jié)時(shí)間序列分析3.2長(zhǎng)期趨勢(shì)的測(cè)定長(zhǎng)期趨勢(shì):是指客觀現(xiàn)象在一段較長(zhǎng)時(shí)期內(nèi),持續(xù)呈現(xiàn)為同一方向發(fā)展變化的趨勢(shì)。季節(jié)變動(dòng):客觀現(xiàn)象因受自然條件或社會(huì)經(jīng)濟(jì)季節(jié)因素的影響,在一年或更短的時(shí)間內(nèi),隨時(shí)序變化而引起的有規(guī)律的周期性變動(dòng)。影響時(shí)間序列的因素歸納起來(lái)有四類,即長(zhǎng)期趨勢(shì)、季節(jié)變動(dòng)、循環(huán)波動(dòng)和不規(guī)則變動(dòng)。季節(jié)變動(dòng):客觀現(xiàn)象因受自然條件或社會(huì)經(jīng)濟(jì)季節(jié)因素的影響,在一年或更短的時(shí)間內(nèi),隨時(shí)序變化而引起的有規(guī)律的周期性變動(dòng)。第三節(jié)時(shí)間序列分析3.3時(shí)間序列的趨勢(shì)分析
測(cè)定長(zhǎng)期趨勢(shì)就是用一定的方法對(duì)時(shí)間序列進(jìn)行修勻,以消除序列中季節(jié)變動(dòng)、循環(huán)波動(dòng)和不規(guī)則變動(dòng)等因素的影響,以顯示出現(xiàn)象變動(dòng)的基本趨勢(shì),作為預(yù)測(cè)的依據(jù)。第三節(jié)時(shí)間序列分析簡(jiǎn)單平均法設(shè)時(shí)間序列已有的
觀測(cè)值為則第期的預(yù)測(cè)值
為當(dāng)有了第期的實(shí)際值,便可計(jì)算出第期的預(yù)測(cè)誤差。第
期的預(yù)測(cè)值為第三節(jié)時(shí)間序列分析
例1某商場(chǎng)2008-2014年的年銷售額見(jiàn)表3-15,試用簡(jiǎn)單平均法預(yù)測(cè)2015年該商場(chǎng)的年銷售額。表3-15某商場(chǎng)2008-2014年的年銷售額年份2008200920102011201220132014銷售額(萬(wàn)元)989610510199110103解:根據(jù)簡(jiǎn)單平均法的計(jì)算公式,可得即預(yù)測(cè)2015年該商場(chǎng)的年銷售額為101.71萬(wàn)元。第三節(jié)時(shí)間序列分析移動(dòng)平均法設(shè)移動(dòng)間隔為,則第期的移動(dòng)平均值為當(dāng)然,也可以用它來(lái)進(jìn)行預(yù)測(cè)。第期的簡(jiǎn)單移動(dòng)平均預(yù)測(cè)值為第三節(jié)時(shí)間序列分析移動(dòng)步長(zhǎng)為奇數(shù)時(shí),移動(dòng)平均數(shù)就是平均期中間一期的“修勻”值移動(dòng)步長(zhǎng)為偶數(shù)時(shí),要進(jìn)行二次平均(即移正平均)表3-16移動(dòng)步長(zhǎng)不同時(shí)平均數(shù)的計(jì)算第三節(jié)時(shí)間序列分析表3-17給出了一個(gè)移動(dòng)平均計(jì)算實(shí)例,圖3-16畫出了移動(dòng)平均的趨勢(shì)線。年份(年)銷售收入三年移動(dòng)平均四年移動(dòng)平均四年移動(dòng)平均修正19881———1989149.67——19901417.3313.2516.2519912421.0019.2519.8819922522.6720.5019.7519931917.3319.0018.131994814.6717.2516.0019951713.3314.7517.8819961525.3321.0025.0019974433.0029.0030.0019984036.3331.0030.2519992524.6729.5028.382000923.0027.2526.6320013526.3326.0029.7520023541.6733.5035.1320035537.3336.7538.3820042241.6740.00—200548———表3-17移動(dòng)平均法計(jì)算實(shí)例單位:萬(wàn)元第三節(jié)時(shí)間序列分析指數(shù)平滑法
其中,是和的加權(quán)平均數(shù),
的取值決定
和對(duì)的影響程度,當(dāng)
時(shí),
;當(dāng)時(shí),設(shè)為第期的實(shí)際觀察值,為第期的預(yù)測(cè)值,
為平滑系數(shù),則第期的預(yù)測(cè)值為第三節(jié)時(shí)間序列分析圖3-16移動(dòng)平均趨勢(shì)線第三節(jié)時(shí)間序列分析解為了分析加權(quán)系數(shù)
的不同取值的特點(diǎn),分別取計(jì)算一次指數(shù)平滑。當(dāng)時(shí),取
則
例2已知某種產(chǎn)品最近15個(gè)月的銷售量見(jiàn)表3-18。
試用一次指數(shù)平滑法預(yù)測(cè)下一個(gè)月的銷售量。時(shí)間序列123456789101112131415銷售量10158201016182022242026272929表3-18某產(chǎn)品最近15個(gè)月的銷售量依次計(jì)算,得表3-19。第三節(jié)時(shí)間序列分析表3-19一次指數(shù)平滑值計(jì)算表根據(jù)表3-19,分別取時(shí),下一個(gè)月的銷售量預(yù)測(cè)值為28.06、28.75、28.98。時(shí)間序列銷售量α=0.5α=0.7α=0.9110.00————
215.0010.0010.0010.0038.0012.5013.5014.50420.0010.259.658.65510.0015.1316.9018.87616.0012.5612.0710.89718.0014.2814.8215.49820.0016.1417.0517.75922.0018.0719.1119.771024.0020.0421.1321.781120.00
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025江蘇鹽城市東臺(tái)市教育局直屬學(xué)校招聘教師、教練員58人考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解1套
- 2025年福建省盲人協(xié)會(huì)招聘1人模擬試卷及一套參考答案詳解
- 中國(guó)鈷胺素行業(yè)市場(chǎng)運(yùn)行態(tài)勢(shì)及發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告-智研咨詢發(fā)布
- 賓陽(yáng)中考模擬考試題目及答案
- 2025年福建省柘榮法院招聘1人考前自測(cè)高頻考點(diǎn)模擬試題附答案詳解
- 智研咨詢發(fā)布:中國(guó)低空消防行業(yè)市場(chǎng)現(xiàn)狀、發(fā)展概況、未來(lái)前景分析報(bào)告
- 疼痛平分課件
- 2025廣西南寧市良慶區(qū)玉洞街道辦事處社區(qū)公益性崗位勞動(dòng)保障協(xié)管員招聘1人模擬試卷附答案詳解
- 2025年總局遴選面試真題及答案
- 化工原料失重率檢驗(yàn)規(guī)程集
- 原發(fā)性醛固酮增多癥診斷治療的專家共識(shí)(2024)解讀
- 《古典音樂(lè)賞析課件》
- 制作扒雞的流程
- 居間房屋租賃合同模板
- 2025年度典型火災(zāi)案例及消防安全知識(shí)專題培訓(xùn)
- 《智慧化工園區(qū)系統(tǒng)運(yùn)維管理要求》
- 外研版九年級(jí)英語(yǔ)上冊(cè)期中綜合測(cè)試卷含答案
- 肝癌中醫(yī)治療新進(jìn)展
- 藥品類體外診斷試劑專項(xiàng)培訓(xùn)課件
- 高中數(shù)學(xué)新教材選擇性必修第二冊(cè)《4.2等差數(shù)列》課件
- 建筑識(shí)圖與構(gòu)造 課件 項(xiàng)目8 識(shí)讀建筑詳圖
評(píng)論
0/150
提交評(píng)論