方差分析舉例_第1頁
方差分析舉例_第2頁
方差分析舉例_第3頁
方差分析舉例_第4頁
方差分析舉例_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余5頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、方差分析舉例一、什么是方差分析例1:某飲料生產(chǎn)企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無色透明。這四種飲料的營養(yǎng)含量、味道、價格、包裝等可能影響銷售量的因素全部相同,先從地理位置相似、經(jīng)營規(guī)模相仿的五家超級市場上收集了前一期該種飲料的銷售量情況,見表10-1。表10-1該飲料在五家超市的銷售情況單位:箱超市無色粉色橘黃色綠色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8合計136.6147.8132.2157.3問飲料的顏色是否對銷售量產(chǎn)生影

2、響。解:從表10-1中看到,20個數(shù)據(jù)各不相同,其原因可能有兩個方面:一是銷售地點(diǎn)不同的影響。即使是相同顏色的飲料,在不同超市的銷售量也是不同的。但是,由于這五個超市地理位置相似、經(jīng)營規(guī)模相仿,因此,可以把不同地點(diǎn)產(chǎn)品銷售量的差異看成是隨機(jī)因素的影響。二是飲料顏色不同的影響。即使在同一個超市里,不同顏色的飲料的銷售量也是不同的。哪怕它們的營養(yǎng)成分、味道、價格、包裝等方面的因素都相同,但銷售量也不相同。這種不同,有可能是由于抽樣的隨機(jī)性造成的,也有可能是由于人們對不同顏色的偏愛造成的。于是,上述問題就歸結(jié)為檢驗(yàn)飲料顏色對銷售量是否有影響的問題。我們可以令卬、舊曲陽分別為四種顏色飲料的平均銷售量,

3、檢驗(yàn)它們是否相等。如果檢驗(yàn)結(jié)果顯示四、g但、因不相等,則意味著不同顏色的飲料來自于不同的總體,表明飲料顏色對銷售量有影響;反之,如果檢驗(yàn)結(jié)果顯示國、叫仍、國之間不存在顯著性差異,則意味著不同顏色的飲料來自于相同的總體,可認(rèn)為飲料顏色對銷售量沒有影響。這就是一個方差分析問題。在方差分析中常用到一些術(shù)語。1 .因素因素是一個獨(dú)立的變量,也就是方差分析研究的對象,也稱為因子。如:例1中,我們要分析飲料的顏色對飲料的銷售量是否有影響,在這里,“飲料的顏色”是所要檢驗(yàn)的對象,它就是一個因素。在有的書中把因素稱為“因子”。2 .水平因素中的內(nèi)容稱為水平,它是因素的具體表現(xiàn)。如:例1中“飲料的顏色”這一因素

4、中的水平有四個,即飲料的四種不同顏色:無色、粉色、桔黃色、綠色;它們是“飲料的顏色”這一因素的四種具體表現(xiàn)。因素的每一個水平可以看作是一個總體,比如:無色、粉色、桔黃色、綠色飲料可以看作是四個總體。3 .控制變量在方差分析中,能夠人為控制的影響因素稱為控制因素,或控制變量;如:例1中,“飲料的顏色”對于飲料的銷售量而言,是能夠人為控制的影響因素,稱為控制變量。4 .隨機(jī)變量在方差分析中,人為很難控制的影響因素稱為隨機(jī)因素,或隨機(jī)變量;如:例1中,“人們對不同顏色的偏愛”對于飲料的銷售量而言,是人為很難控制的影響因素,稱為隨機(jī)變量。5 .觀察變量與觀察值在方差分析中,受控制因素和隨機(jī)因素影響的事

5、物,稱為觀察變量。在每個水平下得到的樣本數(shù)據(jù)稱為觀察值。如:例1中,銷售量是觀察變量,在每個飲料顏色下得到的樣本數(shù)據(jù)(即表10-1中的數(shù)據(jù))就是觀察值。二.方差分析的原理從方差分析的目的來看,是要檢驗(yàn)各個水平的均值國、正、即是否相等(m為水平個數(shù)),而實(shí)現(xiàn)這個目的的手段是通過方差的比較(即考察各觀察數(shù)據(jù)的差異)在變量的觀察值之間存在著差異。差異的產(chǎn)生來自于兩個方面。一個方面是由因素中的不同水平造成的,稱之為系統(tǒng)性差異(或系統(tǒng)性誤差)。如:飲料的不同顏色帶來不同的銷售量。另一個方面是由于抽選樣本的隨機(jī)性而產(chǎn)生的差異,稱之為隨機(jī)性差異(或隨機(jī)性誤差)。如:相同顏色的飲料在不同的商場銷售量也不同。兩

6、個方面產(chǎn)生的差異可以用兩個方差來計量。一個叫組問方差,即水平之間的方差,是衡量不同總體下各樣本之間差異的方差。在組間方差里,既包括系統(tǒng)性誤差,也包括隨機(jī)性誤差。如:在例1中,不同顏色的飲料在不同地點(diǎn)(超市)產(chǎn)品銷售量之間的差異既有系統(tǒng)性誤差(即由于人們對不同顏色的偏愛造成的差異),也有隨機(jī)性誤差(即由于抽樣的隨機(jī)性造成的差異)。不同顏色的飲料在不同地點(diǎn)(超市)產(chǎn)品銷售量之間的方差即為組間方差。另一個叫組內(nèi)方差,即水平內(nèi)部的方差,是衡量同一個總體下樣本數(shù)據(jù)的方差。在組內(nèi)方差里僅包括隨機(jī)性差異。如:在例1中,可以把同一個顏色的飲料在不同地點(diǎn)(超市)產(chǎn)品銷售量之間的差異看成是隨機(jī)因素的影響,同一個顏

7、色的飲料在不同地點(diǎn)(超市)產(chǎn)品銷售量之間的方差即為組內(nèi)方差。如果不同的水平對結(jié)果沒有影響,如:飲料的不同顏色對銷售量無影響,那么在水平之間的方差中,就僅僅有隨機(jī)因素影響的差異,而沒有系統(tǒng)性因素影響的差異。這樣一來,組間方差與組內(nèi)方差就應(yīng)該非常接近,兩個方差的比值就會接近于1;反之,如果飲料的不同顏色對銷售量有影響,在組間方差中就不僅包括了隨機(jī)性誤差,也包括了系統(tǒng)性誤差,這時,組問方差就會大于組內(nèi)方差,兩個方差的比值就會大于1。當(dāng)這個比值大到某種程度時,我們就可以作出判斷,說不同水平之間存在著顯著性差異。一次,方差分析就是通過不同方差的比較,作出接受原假設(shè)或拒絕原假設(shè)的判斷。如:例1中,判斷飲料

8、的不同顏色對銷售量是否有顯著性影響的問題,實(shí)際上也就是檢驗(yàn)銷售量的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)性誤差,我們就說飲料的不同顏色對銷售量有顯著性影響。三、單因素方差分析為說明問題方便,我們以例2為例,闡述單因素方差分析的基本步驟如下:例2:已知在一組給定的條件下飼養(yǎng)小雞所增加的體重服從正態(tài)分布。某養(yǎng)雞場欲檢驗(yàn)四種飼料配方對小雞增重的影響是否不相同(假定已經(jīng)經(jīng)過檢驗(yàn)表明不同飼料配方下的小雞增重方差相等)。為此,他們對四組初始條件完全相同的小雞,在完全相同的其他飼養(yǎng)條件下,分別使用四種不同的飼料配方進(jìn)行喂養(yǎng)。所得到的增重數(shù)據(jù)如表10-2。表102四種不同飼料配方下小雞的增重情

9、況小雞序列j飼料配方i38周后小雞個體增重(克)力123456行合計yi#配方13704204504901730配方24903804003905004102570配方33303404003804701920配方44104804004203804102500列合計vj160016201650168013508208720試分析四種飼料配方對小雞增重的影響是否不相同解:在這里,“飼料”是一個因素,因素中的水平有四個,即小雞增重的四種飼料配方。不同的飼料是小雞飼養(yǎng)隨機(jī)試驗(yàn)的不同條件,因此,四組不同的數(shù)據(jù)應(yīng)分別看作四個不同總體即四個隨機(jī)變量yi、V2、V3、y4各自的樣本。在水平(配方)1下有4個樣本

10、水平值,ni=4;在水平(配方)2下有6個樣本水平值,02=6;在水平(配方)3下有5個樣本水平值,n3=5;在水平(配方)4下有6個樣本水平值,04=6;所以,我們現(xiàn)在的問題是要檢驗(yàn)方差相等的四個正態(tài)隨機(jī)變量yi、丫2、y3、y4的均值(期望值)小、口、仍、因是否相等。有時,人們還會使用另外的提法:增重與飼料配方是否有關(guān)。其實(shí),回答了均值是否相等的問題,自然也就回答了增重與飼料配方是否有關(guān)的問題。因?yàn)槿绻囼?yàn)條件的差別沒有使均值產(chǎn)生差異,自然說明該試驗(yàn)條件不是變量的影響因素,即說明試驗(yàn)條件與變量相互獨(dú)立。對于類似本例的問題,一般地,把隨機(jī)變量分組的數(shù)目記作m,本例m=4o(一)建立假設(shè)我們可

11、建立下列假設(shè)。原假設(shè)H0:因=如;備擇假設(shè)Hi:ipi、,、即不全相等。式中,國為第i個總體(水平)的均值??梢姡瑔我蛩胤讲罘治龅脑僭O(shè)H。是假設(shè)在控制變量的不同水平下,各總體均值無顯著差異。即控制變量的不同水平對觀察變量沒有產(chǎn)生顯著的影響。而備擇假設(shè)Hi是假設(shè)在控制變量的不同水平下,各總體均值有顯著差異。就例2來講,提出的假設(shè)是:原假設(shè)Ho:1=比=所即假設(shè)四個配方的小雞增重均值是相等的。備擇假設(shè)Hi:心的因不全相等;即假設(shè)四個配方對小雞增重有顯著影響。怎樣判斷配方對小雞增重是否有顯著影響呢?這就需要通過對數(shù)據(jù)誤差來源的分析,判斷各總體均值是否相等。首先需要考察各觀察數(shù)據(jù)的誤差。在同一種配方

12、(同一個總體)下,小雞增重是不同的。因此,可以把不同小雞增重的差異看出是隨機(jī)因素的影響,即這種差異是由于抽樣的隨機(jī)性所造成的,稱為隨機(jī)誤差。在不同配方下(不同總體)下,小雞增重也是不同的。這種差異可能是由于抽樣的隨機(jī)性造成的,也可能是由于配方本身造成的。由于配方本身所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)性誤差。衡量同一種配方下樣本數(shù)據(jù)的方差,叫組內(nèi)方差,顯然組內(nèi)方差只包含隨機(jī)誤差。衡量不同種配方下各樣本之間的方差,叫組問方差。而組問方差既包括隨機(jī)性誤差,也包括系統(tǒng)性誤差。如果不同配方對小雞增重沒有影響,則組間方差中只包含隨機(jī)性誤差。這時組間方差與組內(nèi)方差的比值就會接近于1。反之,如果不同配

13、方對小雞增重有影響,則組間方差中既有隨機(jī)性誤差,也有系統(tǒng)性誤差,這時組間方差與組內(nèi)方差的比值就會大于1。當(dāng)這個比值大到某個程度時,我們就可以說不同配方之間存在顯著性差異,從而說明配方對小雞增重有顯著影響(二)計算水平均值假定從第i個總體中抽取一個容量為ni的簡單隨機(jī)樣本,則有:ni_yj第i組樣本平均數(shù)yi=2一(i=1、2、m)n式中,ni為第i個總體的樣本觀察值個數(shù),yj為第i個總體的第j個觀察值就例2來講,配方1的小雞增重均值y1.=(370+420+450+49。+4=432.5克配方2的小雞增重均值y2.=(490+380+400+390+500+41。+6=428.33克配方3的小

14、雞增重均值丫3.=(330+340+400+380+47。+5=384克配方4的小雞增重均值y4.=(410+480+400+420+380+41。+6=416.6克(三)計算全部觀察值的總均值mnim-yj'、ny.總的樣本平均數(shù)匚=ii=%一;nnii1式中,ni為第i組的數(shù)據(jù)個數(shù),m+n2+,+nm=n就例2來講,全部小雞平均增重匚=8720笠1=415.24克n=m+n2+n3+n4=4+6+5+6=21(四)計算離差平方和方差分析采用的統(tǒng)計推斷方法是計算F統(tǒng)計量,進(jìn)行F檢驗(yàn)。因此,為了構(gòu)造檢驗(yàn)的統(tǒng)計量,需要計算三個離差平方和。方差分析將觀察變量總的離差平方和,記為SST,并將

15、它分解成兩個部分:一部分是由控制變量引起的離差,記為SSR即水平項(xiàng)離差平方和(也稱為組問離差平方和BetweenGroup§,;另一部分是由隨機(jī)變量引起的離差,記為SSE,即誤差項(xiàng)離差平方和(也稱為組內(nèi)離差平方和WithinGroups)o于是有:SST=SSR+SSE-y)2式中:總離差平方和mniSST=-、(yji=1j=1mi2m2組問離差平方和SSR='、(yiy.)='ni(yiy.)ij=1i-組內(nèi)離差平方和mniSSE二一(yji=1j=1yQ2以上三式中的總樣本平均數(shù)定義為m一1mniy=-二一'yijmij-ninTj=1i11ni各組樣本

16、平均數(shù)定義為:yi.=;jl1yjini是各組樣本觀測值的個數(shù),n為所有樣本觀測值的個數(shù),m是分組數(shù)目就例2來講,(參見表102中數(shù)據(jù))mni總離差平方和SST=/./.(yj-TL)2i=1j=1=(370-415.24)2+(420-415.24)2+T(380-415.24)2+(410-415.24)2=46923.809mnim組間離差平方和SSR=y/(y,-)2=xni(yr,-T;t)2idj4i1=4X(432.5415.24)2+6X(428.33415.24)2+5X(384415.24)2+6X(416.5415.24)2=7112.142m,一-2或米用SSR=乙ni

17、Yi#-nywi14X(432.5)2+6X(428.33)2+5X(384)2+6X(416.6)2-21><415.24)2=7112.142mni_組內(nèi)離差平方和SSE=vv(yj-彳)2iJj=1=(370-432.5)2+(420-432.5)2+(450-432.5)2+(490-432.5)2+(490-428.33)2+(380-428.33)2+(400-428.33)2+(390-428.33)2+(500-428.33)2+(410-428.33)2+(330-384)2+(340-384)2+(400-384)2+(380-384)2+(470-384)2+

18、(410-416.6)2+(480-416.6)2+(400-416.6)2+(420-416.6)2+(380-416.6)2+(410-416.6)2=39811.667m%m(或采用SSE=22yi2-En辰=3667800-3627988.333=39811.677)i4j4i4(五)構(gòu)造統(tǒng)計量并計算檢驗(yàn)統(tǒng)計量的樣本值l組間方差MSRSSR/(m-1)7112.142/(4-1)2370.7141F=101組內(nèi)方差MSESSE/(n-m)39811.667/(21-4)2341.863(六)確定檢驗(yàn)規(guī)則、列出方差分析表、做出統(tǒng)計決策P-值規(guī)則:根據(jù)算得的檢驗(yàn)統(tǒng)計量的樣本值(F值)算出P

19、-值=0.411573(見表10-3)由于P-值=0.411573>顯著水平標(biāo)準(zhǔn)"=0.05,所以不能拒絕Ho,即沒有得到足以表明四種配方的飼料下小雞增重水平有差異的顯著證據(jù)臨界值規(guī)則:根據(jù)給定的顯著水平a=0.05,查表得臨界值為Fo.o5(3,17)=3.20。因?yàn)镕=1.01<3.20,檢驗(yàn)統(tǒng)計量的樣本值落入接受域,所以不能拒絕Ho,即沒有得到足以表明四種配方的飼料下小雞增重水平有差異的顯著證據(jù)。表10-3方差分析表變異來源離差平方和自由度均力左F值P-值臨界值組問7112.14332370.7141.012320.4115733.196774組內(nèi)39811.671

20、72341.863總計46923.8120例3:由前例1表101的“四種顏色飲料銷售量在五家超市的銷售情況”數(shù)據(jù),對飲料的顏色是否對銷售量產(chǎn)生影響做方差分析。解:第一步、建立假設(shè)原假設(shè)H0:1=代=田=因;即假設(shè)顏色對銷售量沒有影響。備擇假設(shè)Hi:i快g田、脩不全相等;即假設(shè)四個配方顏色對銷售量有影響第二步、計算水平均值無色飲料銷售量均值=136.6+5=27.32箱粉色飲料銷售量均值147.8+5=29.56箱桔黃色飲料銷售量均值y3.=132.2+5=26.44箱綠色飲料銷售量均值157.3+5=31.46箱第三步、計算全部觀察值的總均值各種顏色飲料銷售量總的樣本平均數(shù)匚,=(136.6+147.8+132.2+157.3120=28.695箱第四步、計算離差平方和mn總離差平方和SST=:?(yj-TL)2i1j=1=(26.528.695)2+(28.728.695)2+T(32.8-28.695)2=115.9295mnim組間離差平方和ssr=:2(7.-匚)2=、ni(y.-y)2i凸jmi1=5X(27.3228.695)2+5義(29.5628.695)2,一一一、2,一一一一、2+5X(26.4428.695)+5X(31.4628.695)=76.8455mni組內(nèi)離差平方和SSE=£Z(yj-元2i=1jd=10.688+8.572+13.192

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論