應(yīng)用統(tǒng)計(jì)學(xué)課件-11_第1頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)課件-11_第2頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)課件-11_第3頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)課件-11_第4頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)課件-11_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十一章

方差分析科學(xué)法則并不是由權(quán)威的原理所引導(dǎo)的,也不會(huì)由信仰或中世紀(jì)哲學(xué)來辯明的;統(tǒng)計(jì)學(xué)是訴諸新知識(shí)的惟一法庭。----

馬哈拉諾比斯我們國(guó)家的藥廠,都喜歡白色的藥丸和制劑,自認(rèn)為白色有清潔感,并未從細(xì)節(jié)處考慮藥片的顏色與銷售有何關(guān)系。德國(guó)人對(duì)白色的藥片缺乏信心,覺得藥性不強(qiáng),而且白色沒有深淺之分,連醫(yī)生自己也容易搞錯(cuò)。美國(guó)人都知道檸檬和橙子最富維生素C,所以黃色藥片最為好銷,橙色次之,白色再次之。----

汪中求4/3/20241Jinlong第十一章方差分析科學(xué)法則并不是由權(quán)威的原理所引導(dǎo)的,也不會(huì)本章主要內(nèi)容一、方差分析概述二、單因素方差分析三、雙因素方差分析4/3/20242Jinlong本章主要內(nèi)容一、方差分析概述4/2/20242Jinlong方差分析舉例超市無(wú)色(A1)粉色(A2)橘色(A3)綠色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8顏色對(duì)藥片銷量有否影響?顏色對(duì)飲料銷量有否影響?某廠研制出一種新型飲料,其顏色有橘色、粉色、綠色和無(wú)色四種。假設(shè)這些飲料的營(yíng)養(yǎng)含量、味道、價(jià)格、包裝等影響銷量的因素全部相同,試分析飲料的顏色是否影響飲料的銷量。(有關(guān)數(shù)據(jù)見右表)表中數(shù)據(jù)是從地理位置相似、經(jīng)營(yíng)規(guī)模相仿的五家超級(jí)市場(chǎng)上,收集的前一時(shí)期該飲料的銷量。4/3/20243Jinlong方差分析舉例超市無(wú)色粉色橘色綠色126.531.227.93上例分析檢驗(yàn)飲料的顏色對(duì)銷量是否有影響,也就是檢驗(yàn)四種顏色飲料的平均銷量是否相同。設(shè)

1為無(wú)色飲料的平均銷量,

2為粉色飲料的平均銷量,

3為橘色飲料的平均銷量,

4為綠色飲料的平均銷量。

本題就是檢驗(yàn)下面的假設(shè):

H0:1

2

3

4;H1:1,2,3,4不全相等。

方差分析就是檢驗(yàn)上述假設(shè)所采用的一種方法。4/3/20244Jinlong上例分析檢驗(yàn)飲料的顏色對(duì)銷量是否有影響,也就是檢驗(yàn)四種顏一、方差分析概述概念:檢驗(yàn)多個(gè)總體均值是否相等,用于分析完全隨機(jī)化試驗(yàn)設(shè)計(jì)。假定:每個(gè)總體都服從正態(tài)分布;各個(gè)總體的方差相同;觀察值是獨(dú)立的。術(shù)語(yǔ):下頁(yè)。原理:比較兩類誤差,以檢驗(yàn)均值是否相等。(后述)4/3/20245Jinlong一、方差分析概述概念:檢驗(yàn)多個(gè)總體均值是否相等,用于分析完全方差分析的基本術(shù)語(yǔ)

因素或因子:要分析飲料的顏色對(duì)銷量是否有影響,顏色A就是要檢驗(yàn)的因素或因子。

水平:因素的具體表現(xiàn)稱為水平,四種顏色A1、A2、A3、A4就是因素A的四個(gè)水平。

試驗(yàn):這里只涉及一個(gè)因素,故稱為單因素四水平的試驗(yàn)。

總體:因素的每一個(gè)水平可以看作是一個(gè)總體,四種顏色可以看作是四個(gè)總體A1、A2、A3、A4。

樣本數(shù)據(jù):也稱觀察值,在每個(gè)因素水平下得到的觀察值,每種顏色飲料的銷量就是從四個(gè)總體中抽取的樣本數(shù)據(jù)。4/3/20246Jinlong方差分析的基本術(shù)語(yǔ)因素或因子:要分析飲料的顏色對(duì)銷量是否比較兩類誤差,以檢驗(yàn)均值是否相等。如果系統(tǒng)誤差(處理誤差)顯著地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的。誤差是由各部分的誤差占總誤差的比例來測(cè)度的。比較的基礎(chǔ)是方差比。方差分析原理4/3/20247Jinlong比較兩類誤差,以檢驗(yàn)均值是否相等。方差分析原理4/2/202系統(tǒng)誤差與隨機(jī)誤差

系統(tǒng)誤差:在因素的不同水平(不同總體)下,各觀察值之間的差異。比如,同一家超市,不同顏色飲料的銷量是不同的,這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的系統(tǒng)誤差。

隨機(jī)誤差:在因素的同一水平(同一個(gè)總體)下,樣本的各觀察值之間的差異。比如,同一種顏色的飲料在不同超市上的銷量是不同的,不同超市銷量的差異可以看成是隨機(jī)因素的影響的隨機(jī)誤差。4/3/20248Jinlong系統(tǒng)誤差與隨機(jī)誤差系統(tǒng)誤差:在因素的不同水平(不同總體)組間方差與組內(nèi)方差

組間方差:因素的不同水平(不同總體)下各樣本之間的方差。比如,A1、A2、A3、A4四種顏色飲料銷量之間的方差。組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差

組內(nèi)方差:因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的方差。比如,無(wú)色飲料A1在5家超市銷售數(shù)量的方差。組內(nèi)方差只包含隨機(jī)誤差。4/3/20249Jinlong組間方差與組內(nèi)方差組間方差:因素的不同水平(不同總體)下方差的比較如果不同顏色(水平)對(duì)銷量(結(jié)果)沒有影響,那么在組間方差中只包含有隨機(jī)誤差,而沒有系統(tǒng)誤差。這時(shí),組間方差與組內(nèi)方差就應(yīng)該很接近,兩個(gè)方差的比值就會(huì)接近1。如果不同的水平對(duì)結(jié)果有影響,在組間方差中除了包含隨機(jī)誤差外,還會(huì)包含有系統(tǒng)誤差,這時(shí)組間方差就會(huì)大于組內(nèi)方差,組間方差與組內(nèi)方差的比值就會(huì)大于1。當(dāng)這個(gè)比值大到某種程度時(shí),就可以說不同水平之間存在著顯著差異。4/3/202410Jinlong方差的比較如果不同顏色(水平)對(duì)銷量(結(jié)果)沒有影響,那么如果原假設(shè)成立如果原假設(shè)成立:H0:

1

2

3

4,也即四種顏色飲料銷量的平均數(shù)都相等,也即沒有系統(tǒng)誤差。這意味著每個(gè)樣本都來自平均數(shù)為

、方差為

2的同一正態(tài)總體。Xf(X)

1=

2=

3=

4

4/3/202411Jinlong如果原假設(shè)成立如果原假設(shè)成立:H0:12如果備擇假設(shè)成立如果備擇假設(shè)成立:H1:

mi(i=1,2,3,4)不全相等,即四種顏色飲料銷量的平均數(shù)不全相等,也即存在系統(tǒng)誤差。這意味著四個(gè)樣本分別來自平均數(shù)不同的四個(gè)正態(tài)總體。

Xf(X)

3

1

2

4

4/3/202412Jinlong如果備擇假設(shè)成立如果備擇假設(shè)成立:H1:mi(i=二、單因素方差分析數(shù)據(jù)結(jié)構(gòu):見下表?;静襟E:提出假設(shè);構(gòu)造檢驗(yàn)統(tǒng)計(jì)量;做出決策。多重比較:對(duì)總體平均數(shù)進(jìn)行配對(duì)比較,進(jìn)一步檢驗(yàn)到底哪些平均數(shù)之間存在差異。(選講)4/3/202413Jinlong二、單因素方差分析數(shù)據(jù)結(jié)構(gòu):見下表。4/2/202413J單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

觀察值(

j)因素A(

i

)水平A1水平A2

…水平Ak12::n

x11x12…x1kx21x22…x2k::::::::xn1

xn2…xnk4/3/202414Jinlong單因素方差分析的數(shù)據(jù)結(jié)構(gòu)觀察值(j)因素A(i)水提出假設(shè)一般提法H0:

1

2

3…=k

(因素有k個(gè)水平)H1:

1、2、3、…k不全相等對(duì)于前例H0:

1

2

3

4

顏色對(duì)銷量無(wú)影響H1:

1、2、3、4不全相等

顏色對(duì)銷量有影響4/3/202415Jinlong提出假設(shè)一般提法4/2/202415Jinlong構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為檢驗(yàn)H0(

m1=m2=…=mk)是否成立,需確定檢驗(yàn)的統(tǒng)計(jì)量:

構(gòu)造統(tǒng)計(jì)量需要計(jì)算各水平的平均數(shù)全部觀察值的總平均數(shù)三個(gè)離差平方和兩個(gè)方差4/3/202416Jinlong構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為檢驗(yàn)H0(m1=m2=…=mk)是否成立水平平均數(shù)與總平均數(shù)

四種顏色飲料的銷量及平均數(shù)超市(j)水平A(i)無(wú)色(A1)粉色(A2)橘色(A3)綠色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合計(jì)136.6147.8132.2157.3573.9水平平均數(shù)觀察值個(gè)數(shù)

x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5總平均數(shù)x=28.6954/3/202417Jinlong水平平均數(shù)與總平均數(shù)四種顏色飲料的銷量及平均數(shù)超市水平A三個(gè)離差平方和總離差平方和(SST)總平方和誤差項(xiàng)離差平方和(SSE)組內(nèi)平方和水平項(xiàng)離差平方和

(SSA)

組間平方和4/3/202418Jinlong三個(gè)離差平方和總離差平方和(SST)三個(gè)平方和的關(guān)系SST反映了全部數(shù)據(jù)總的誤差程度;SSE反映了隨機(jī)誤差的大小;SSA反映了隨機(jī)誤差和系統(tǒng)誤差的大小。SST=SSE+SSA前例:115.925=39.084+76.844/3/202419Jinlong三個(gè)平方和的關(guān)系SST反映了全部數(shù)據(jù)總的誤差程度;4/2/2兩個(gè)方差如果原假設(shè)成立,則表明沒有系統(tǒng)誤差,組間平方和SSA除以自由度后的方差與組內(nèi)平方和SSE除以自由度后的方差的差異就不會(huì)太大;如果組間方差顯著地大于組內(nèi)方差,就說明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差。三個(gè)平方和的自由度分別是SST:N-1[N為全部觀察值個(gè)數(shù)]SSA:k-1[k為因素水平(總體)個(gè)數(shù)]SSE:N-k[k(n-1)=N-k]4/3/202420Jinlong兩個(gè)方差如果原假設(shè)成立,則表明沒有系統(tǒng)誤差,組間平方和SS計(jì)算檢驗(yàn)統(tǒng)計(jì)量

FSSA/k-1=MSA,SSE/N-k=MSE將MSA和MSE進(jìn)行對(duì)比,得到所需要的檢驗(yàn)統(tǒng)計(jì)量F。當(dāng)H0為真,二者的比值服從分子自由度為k-1、分母自由度為N-k的F分布,即

前例:F4/3/202421Jinlong計(jì)算檢驗(yàn)統(tǒng)計(jì)量FSSA/k-1=MSA,SSE/F分布與拒絕域如果均值相等,F(xiàn)=MSA/MSE1a

F

(k-1,N-k)0拒絕H0接受H0FF分布4/3/202422JinlongF分布與拒絕域如果均值相等,F(xiàn)=MSA/MSE1aF做出決策

將統(tǒng)計(jì)量的值F與給定的顯著性水平

的臨界值F

進(jìn)行比較,做出接受或拒絕原假設(shè)H0的決策。若F>F

,則拒絕原假設(shè)H0,表明平均數(shù)值之間的差異是顯著的,所檢驗(yàn)的因素(A)對(duì)觀察值有顯著影響。若F

F

,則不能拒絕原假設(shè)H0,表明所檢驗(yàn)的因素(A)對(duì)觀察值沒有顯著影響。前例,F(xiàn)=10.486;而F0.05(3,16)=3.24,F(xiàn)0.01(3,16)=5.29因?yàn)镕>F

,所以拒絕原假設(shè),表明飲料顏色對(duì)飲料銷量有顯著影響。4/3/202423Jinlong做出決策將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行多重比較*多重比較是通過對(duì)總體平均數(shù)之間的配對(duì)比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異。Fisher提出的最小顯著差異方法(LSD)可用于判斷到底哪些均值之間有差異。LSD方法是對(duì)檢驗(yàn)兩個(gè)總體平均數(shù)是否相等的t檢驗(yàn)方法的總體方差估計(jì)加以修正(用MSE來代替)而得到的。*選講4/3/202424Jinlong多重比較*多重比較是通過對(duì)總體平均數(shù)之間的配對(duì)比較來進(jìn)一步檢多重比較的步驟提出假設(shè):H0:

mi=mj(第i個(gè)總體的平均數(shù)等于第j個(gè)總體的平均數(shù))H1:

mi

mj(第i個(gè)總體的平均數(shù)不等于第j個(gè)總體的平均數(shù))計(jì)算檢驗(yàn)統(tǒng)計(jì)量:做出決策:若|t|

t

,拒絕H0;若|t|<t

,接受H04/3/202425Jinlong多重比較的步驟提出假設(shè):4/2/202425Jinlong二、雙因素方差分析概念要點(diǎn):分別對(duì)兩個(gè)因素(A、B)進(jìn)行檢驗(yàn),分析是一個(gè)因素在起作用、兩個(gè)因素都起作用、還是兩個(gè)因素都不起作用。雙因素方差分析分為:無(wú)交互作用的雙因素方差分析

有交互作用的雙因素方差分析數(shù)據(jù)結(jié)構(gòu):見下表。基本步驟:提出假設(shè),構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,做出決策。4/3/202426Jinlong二、雙因素方差分析概念要點(diǎn):分別對(duì)兩個(gè)因素(A、B)進(jìn)行檢驗(yàn)雙因素方差分析數(shù)據(jù)結(jié)構(gòu)

因素A(

i)

因素B(

j)

平均數(shù)

B1B2…BrA1A2::Ak

x11x12…x1kx21x22…x2k::::::::xr1

xr2…

xrk

::平均數(shù)…4/3/202427Jinlong雙因素方差分析數(shù)據(jù)結(jié)構(gòu)因素A因素B(j)平均數(shù)提出假設(shè)對(duì)因素A提出的假設(shè)為H0:m1=m2=…=mi=…=mk

H1:mi

(i=1,2,…,k)不全相等

(mi為第i個(gè)水平的平均數(shù))對(duì)因素B提出的假設(shè)為H0:m1=m2=…=mj=…=mr

H1:mj(j=1,2,…,r)不全相等

(mj為第j個(gè)水平的平均數(shù))4/3/202428Jinlong提出假設(shè)對(duì)因素A提出的假設(shè)為4/2/202428Jinlon構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為檢驗(yàn)H0是否成立,需構(gòu)建檢驗(yàn)的統(tǒng)計(jì)量(后述)為構(gòu)造統(tǒng)計(jì)量,需要計(jì)算總離差平方和:SST水平項(xiàng)平方和:SSA、SSB誤差項(xiàng)平方和:SSE方差:MSA、MSB、MSE

SST=SSA+SSB+SSE4/3/202429Jinlong構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為檢驗(yàn)H0是否成立,需構(gòu)建檢驗(yàn)的統(tǒng)計(jì)量(后述)計(jì)算方差因素A的方差,記為MSA,計(jì)算公式為因素B的方差,記為MSB,計(jì)算公式為隨機(jī)誤差項(xiàng)的方差,記為MSE,計(jì)算公式為4/3/202430Jinlong計(jì)算方差因素A的方差,記為MSA,計(jì)算公式為4/2/2024計(jì)算檢驗(yàn)統(tǒng)計(jì)量

F為檢驗(yàn)因素A的影響是否顯著,采用統(tǒng)計(jì)量

為檢驗(yàn)因素B的影響是否顯著,采用統(tǒng)計(jì)量4/3/202431Jinlong計(jì)算檢驗(yàn)統(tǒng)計(jì)量F為檢驗(yàn)因素A的影響是否顯著,采用統(tǒng)計(jì)量4做出決策

將統(tǒng)計(jì)量的值F與給定的顯著性水平

的臨界值F

進(jìn)行比較,作出接受或拒絕原假設(shè)H0的決策。若FA

F

,則拒絕原假設(shè)H0,表明均值之間的差異是顯著的,即所檢驗(yàn)的因素A對(duì)觀察值有顯著影響。和若FB

F

,則拒絕原假設(shè)H0,表明均值之間有顯著差異,即所檢驗(yàn)的因素B對(duì)觀察值有顯著影響。4/3/202432Jinlong做出決策將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行雙因素方差分析舉例有四個(gè)品牌的彩電在五個(gè)地區(qū)銷售,為分析品牌(因素A)和銷售地區(qū)(因素B)對(duì)銷量是否有影響,對(duì)每個(gè)品牌在各地區(qū)的銷量取得以下數(shù)據(jù)(下頁(yè))。試分析品牌和銷售地區(qū)對(duì)彩電的銷量是否有顯著影響?4/3/202433Jinlong雙因素方差分析舉例有四個(gè)品牌的彩電在五個(gè)地區(qū)銷售,為分析不同品牌的彩電在各地區(qū)的銷售量品牌(因素A)銷售地區(qū)(因素B)B1B2B3B4B5A1A2A3A436534535828835036832328034336335329834033034

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論