




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第
10
章
假設(shè)檢驗(yàn)【學(xué)習(xí)目標(biāo)】建立解假設(shè)檢驗(yàn)的基本概念,掌握假設(shè)檢驗(yàn)的基本原理;理解僅依靠樣本進(jìn)行決策的風(fēng)險(xiǎn);能運(yùn)用假設(shè)檢驗(yàn)解決各種實(shí)際問題;掌握用
p值方法進(jìn)行假設(shè)檢驗(yàn)。10.1概述10.1.1假設(shè)檢驗(yàn)在經(jīng)濟(jì)管理活動(dòng)中,人們需要對各種各樣的現(xiàn)象進(jìn)行判斷,以期做出正確的決策。但是,人們所面對的是往往是隨機(jī)現(xiàn)象,并且所掌握和信息也是有限的,于是就產(chǎn)生了這樣一個(gè)問題:怎樣利用較少的信息對總體現(xiàn)象進(jìn)行決策。下面我們通過一個(gè)例子來說明這個(gè)問題?!纠?/p>
10-1】全國政協(xié)委員馮丹龍建議:完善兒童用藥安全管理
3
月
3
日,全國政協(xié)委員、馮玉祥之孫女馮丹龍,在接受法制晚報(bào)·看法新聞?dòng)浾卟稍L時(shí)表示,今年她的建議是建立和完善兒童用藥法律法規(guī),同時(shí)加強(qiáng)對兒童藥品研發(fā)生產(chǎn)的監(jiān)管。馮丹龍認(rèn)為,兒童用藥,安全是重中之重。兒童作為一個(gè)特殊用藥群體,各器官發(fā)育未成熟,對藥品的用法用量有其特殊要求。目前,臨床上兒童用藥不當(dāng)方面均有不同程度的問題,需要及時(shí)改進(jìn)和提高。
據(jù)《半月談》雜志報(bào)道,中國兒童用藥不良反應(yīng)發(fā)生率為
12.9%,其中新生兒高達(dá)
24.4%,分別是成人的
2
倍和
4
倍。中國醫(yī)藥工業(yè)信息中心的數(shù)據(jù)顯示,全國藥品生產(chǎn)企業(yè)有
8000多家,其中專門生產(chǎn)兒童用藥的企業(yè)僅占
0.1%。在藥品臨床實(shí)驗(yàn)注冊項(xiàng)目中,國產(chǎn)藥品注冊信息達(dá)到
16
萬多條,其中兒童藥品僅有2000
多條。
目前,兒童給藥劑量多依據(jù)成人劑量,再通過體重?fù)Q算、體表面積換算、年齡換算等方法來確定?!皟和^非成人的‘微縮版’,具有其本身的生理特點(diǎn)。將成人藥酌減給兒童使用,缺乏科學(xué)依據(jù)和循證醫(yī)學(xué)證據(jù)?!焙幽鲜∪嗣襻t(yī)院兒科主任高麗表示。(北青網(wǎng)
2018-03-03)
生產(chǎn)兒童藥物劑量控制非常重要,劑量少了達(dá)不到治療效果,劑量大了可能出現(xiàn)不良反應(yīng)。在生產(chǎn)過程中,我們怎樣判斷兒童藥物的劑量是否合格呢?顯然,不可能將全部的藥物都進(jìn)行檢測,我們能做的只是檢測其中的一小部分。
假設(shè)一條生產(chǎn)兒童注射液的自動(dòng)生產(chǎn)線的標(biāo)準(zhǔn)劑量是每支
12ml,由于各種偶然因素的影響,生產(chǎn)過程中罐裝劑量可能會(huì)產(chǎn)生偏差,假設(shè)允許偏差為
0.5ml。如果某一天,質(zhì)檢檢測了
36
支,得到平均值為
12.3ml,這時(shí)生產(chǎn)線工作正常嗎?解:這個(gè)問題可以歸納為一個(gè)統(tǒng)計(jì)問題:
生產(chǎn)線生產(chǎn)正常時(shí)標(biāo)準(zhǔn)劑量為
12ml,即總體均值
12
;允許的偏差為
0.5ml,即總體的標(biāo)準(zhǔn)差
0.5
;抽取樣本容量為
36
的樣本,得到
。這時(shí),我們能否依據(jù)這個(gè)樣本信息判斷
12
還成立嗎?
這個(gè)問題我們有兩個(gè)選擇:
12(生產(chǎn)線工作正常)和
12(生產(chǎn)線工作不正常),在總體標(biāo)準(zhǔn)差
0.5
的條件下,抽取樣本容量為36
的樣本,已知的樣本信息是
。我們希望利用這個(gè)樣本信息來對上述兩個(gè)選擇做出決策。樣本均值是統(tǒng)計(jì)量,是隨機(jī)變量,而總體均值是參數(shù),是確定的值,我們的目的是利用統(tǒng)計(jì)量來對參數(shù)的取值做出判斷。一般地,利用樣本統(tǒng)計(jì)量對總體參數(shù)的取值做出決策的統(tǒng)計(jì)方法,稱為假設(shè)檢驗(yàn)。10.1.2.假設(shè)檢驗(yàn)的方法
一般來說,假設(shè)檢驗(yàn)可以分成四個(gè)步驟:1)建立假設(shè);2)確定檢驗(yàn)統(tǒng)計(jì)量以及分布;3)設(shè)定顯著性水平,確定臨界值和拒絕域;4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,做出決策。每個(gè)步驟的變化都會(huì)產(chǎn)生不同的假設(shè)檢驗(yàn),我們分步驟具體解釋假設(shè)檢驗(yàn)的基本概念和方法。1.假設(shè)
所謂假設(shè)就是某些對客觀事物特征的初始判斷或者說斷言;用統(tǒng)計(jì)語言表達(dá)就是對總體參數(shù)的取值所作的斷言。由于這些斷言成立的理由并不充分,所以有對這些斷言進(jìn)行檢驗(yàn)的要求。
例如,在例
10-1
中,我們需要經(jīng)常監(jiān)測生產(chǎn)線的工作狀態(tài)。雖然有嚴(yán)格的標(biāo)準(zhǔn)和先進(jìn)的生產(chǎn)線,但由于生產(chǎn)過程會(huì)受到各樣偶然因素的影響,罐裝劑量可能會(huì)偏離標(biāo)準(zhǔn)劑量。在這里
12(生產(chǎn)線工作正常)就是一個(gè)假設(shè)(斷言),但是這個(gè)假設(shè)不一定成立,即可能出現(xiàn)另外一種情況:
12
(生產(chǎn)線工作不正常),如果是這種情況則需要對生產(chǎn)線的生產(chǎn)狀態(tài)進(jìn)行檢修。假設(shè)包括原假設(shè)和備擇假設(shè)。原假設(shè)記為H
0
,是研究者懷疑的、反對的,而且是要被檢驗(yàn)的假設(shè)。在例
10-1
中,H
0
:
12
就是原假設(shè),質(zhì)檢人員(研究者)之所以進(jìn)行檢測,就是懷疑生產(chǎn)線工作不正常,檢測的目的就是在判斷
12
是否成立。備擇假設(shè)記為
H1
,是研究者支持的假設(shè)。在例
10-1
中,H1
:
12
就是備擇假設(shè),是質(zhì)檢人員(研究者)之所以進(jìn)行檢測,就是支持
12
。原假設(shè)和備擇假設(shè)構(gòu)成完備事件組,非此既彼,不存在第三種情況。假設(shè)檢驗(yàn)的目的就是搜集證據(jù)反對(檢驗(yàn))原假設(shè),如果沒有足夠的證據(jù)拒絕原假設(shè),則只能選擇其反面—不拒絕原假設(shè)。
為了進(jìn)行假設(shè)檢驗(yàn),首要步驟就是建立假設(shè)。一般情況下先建立備擇假設(shè),這是因?yàn)閭鋼窦僭O(shè)是研究者支持的假設(shè),一般觀點(diǎn)明確,容易表達(dá)。當(dāng)備擇假設(shè)確定后,其對立事件就是原假設(shè)?!纠?/p>
10-2】某果汁飲料包裝容量為
500ml/盒,灌裝過多或過少都會(huì)被認(rèn)為包裝的容量不合格。質(zhì)檢人員需要定期抽樣檢測容量,判斷灌裝生產(chǎn)線生產(chǎn)是否正常,試建立對應(yīng)的假設(shè)。解:這個(gè)問題中質(zhì)檢人員是研究者,他支持的觀點(diǎn)是生產(chǎn)線生產(chǎn)不正常,否則他就不需要進(jìn)行檢測了。由于灌裝過多或過少都會(huì)被認(rèn)為不正常,故備擇假設(shè)為:H1
:
500,從而原假設(shè)為:H
0
:
500
?!纠?/p>
10-3】某品牌汽車輪胎的生產(chǎn)商聲稱其生產(chǎn)的輪胎行駛里程不少于
80000km。
為了驗(yàn)證這個(gè)說法,某汽車俱樂部對該品牌輪胎的行駛里程進(jìn)行抽樣調(diào)查,試建立對應(yīng)的假設(shè)。解:這個(gè)問題中汽車俱樂部是研究者,他支持的觀點(diǎn)是該品牌輪胎的行駛里程達(dá)不到
80000km,否則他就不會(huì)進(jìn)行抽樣調(diào)查。由于他支持的觀點(diǎn)是該品牌輪胎的行駛里程達(dá)不到
80000km,故備擇假設(shè)為:
H1
:
80000
,從而原假設(shè)為:
H
0
:
80000
。
由上述兩個(gè)例子可以看出建立假設(shè)的一些特點(diǎn):1)假設(shè)有不同的方向性。在例
10-2
中,樣本統(tǒng)計(jì)量的值比
500
過大或過?。p側(cè)),都有一定的理由拒絕H
0
:
500
,這樣的檢驗(yàn)稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn);在例
10-3
中,樣本統(tǒng)計(jì)量的值只有比
80000過?。▎蝹?cè))才有一定理由拒絕H
0
:
80000
,這樣的檢驗(yàn)稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)。表
10-1
總體均值假設(shè)檢驗(yàn)的基本形式
設(shè)
為總體均值,
0為假設(shè)的總體均值的取值,我們可以將假設(shè)的基本形式總結(jié)如表
10-1
所示的形式。假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)
備擇假設(shè)
假設(shè)的方向性與具體的問題有關(guān),也與研究者的地位有關(guān),因?yàn)椴煌匚坏难芯空邥?huì)有不同的觀點(diǎn)。如在例
10-2中,如果研究者換成工商管理人員,他可能更關(guān)心的是果汁生產(chǎn)廠商是否對消費(fèi)者有欺詐行為,也就是H1
:
500
,這時(shí)就有H
0
:
500
,這是一個(gè)單側(cè)檢驗(yàn)中的左側(cè)檢驗(yàn)。2)假設(shè)中所有的等號“=”設(shè)置在原假設(shè)中。包括“=”、“≤”、“≥”都設(shè)置在原假設(shè)中,這是因?yàn)榧僭O(shè)檢驗(yàn)是目的是檢驗(yàn)原假設(shè),而且在邏輯方法是反證法—先假設(shè)原假設(shè)為真,再試圖導(dǎo)出矛盾的結(jié)果,這樣就要求原假設(shè)要“明確”地包含所有要檢驗(yàn)的情況。3)上述例子中只涉及到總體均值的假設(shè),類似的可以建立總體比率、總體方差的假設(shè),同樣有雙側(cè)和單側(cè)檢驗(yàn)。2.檢驗(yàn)統(tǒng)計(jì)量
對不同的總體參數(shù)進(jìn)行檢驗(yàn),需要用到不同的樣本統(tǒng)計(jì)量。如對總體均值進(jìn)行檢驗(yàn),需要用到樣本均值;對總體比率進(jìn)行檢驗(yàn),需要用到樣本比率;對總體方差進(jìn)行檢驗(yàn),需要用到樣本方差等等。但是,樣本統(tǒng)計(jì)量并不能很好地幫助我們做出判斷,進(jìn)行參數(shù)的假設(shè)檢驗(yàn)需要構(gòu)造檢驗(yàn)統(tǒng)計(jì)量。
我們以例
10-1
來說明。生產(chǎn)線生產(chǎn)正常時(shí)標(biāo)準(zhǔn)劑量為12ml,即總體均值
12
;允許的偏差為0.5ml,即總體的標(biāo)準(zhǔn)差
0.5
;抽取樣本容量為36
的樣本,得到
。這時(shí),我們能否依據(jù)這個(gè)樣本信息判斷
12
還成立嗎?
這個(gè)問題要對下列假設(shè)進(jìn)行檢驗(yàn):
H
0
:
12
,
H1
:
12
。
顯然,樣本統(tǒng)計(jì)量
偏離總體均值
越遠(yuǎn),我們拒絕原假設(shè)的理由就越充分?,F(xiàn)在我們得到的樣本統(tǒng)計(jì)量
,這個(gè)值偏離
12
足夠遠(yuǎn)嗎?雖然絕對差異只有
0.3,但是這是
36
支的平均差異,因?yàn)檎`差有正有負(fù),可以互相抵消,0.3
可能是一個(gè)很大的差異。為此,我們要構(gòu)造檢驗(yàn)統(tǒng)計(jì)量進(jìn)行判斷。
我們先假定原假設(shè)為真,即
12
。由于樣本容量為
36(大樣本),
0.5
(總體方差已知),由中心極限定理得:(10-1)
由于
服從正態(tài)分布,在
12
為真的假定條件下,的取值偏離
12
足夠遠(yuǎn)的概率是非常小的,所以我們可以用概率來表示
偏離
12
的程度。設(shè)
的取值偏離
12
足夠遠(yuǎn)的概率為
,在雙側(cè)檢驗(yàn)中
相對于
12
的偏離可以是正偏離,也可以負(fù)偏離,所以
被平分在兩側(cè),單側(cè)面積為
,如圖
10-1
所示。于是我們就可以有一個(gè)直觀的判斷:如果
的值落入圖
10-1
中的陰影部分區(qū)域,
的值就偏離
12
足夠遠(yuǎn),就有足夠的理由拒絕原假設(shè),否則不拒絕原假設(shè)。圖
10-1
樣本均值的分布
現(xiàn)在得到的
,這個(gè)值落入到如圖
10-1
所示的陰影部分區(qū)域了嗎?從絕對差異顯然是不好判斷的,為此我們做標(biāo)準(zhǔn)化變換:(10-2)
將
的抽樣分布變換為標(biāo)準(zhǔn)正態(tài)分布,如圖
10-2
所示。經(jīng)過標(biāo)準(zhǔn)化變換后,將
12
變換到
z=0,兩側(cè)陰影部分的面積不發(fā)生變化。圖
10-2
標(biāo)準(zhǔn)正態(tài)分布由公式(10-2)可以計(jì)算得:(10-3)
即標(biāo)準(zhǔn)化變換將
變換到了z=3.6。如果
z=3.6
偏離
0
足夠的遠(yuǎn),即落入到圖
10-2
的陰影部分區(qū)域,則
就一定落入到圖10-1
的陰影部分區(qū)域,這時(shí)
偏離
12
足夠的遠(yuǎn),我們就有足夠的理由拒絕原假設(shè)?,F(xiàn)在的問題是我們怎樣判斷
z=3.6
是否落入到圖
10-1
的陰影部分區(qū)域。
由于標(biāo)準(zhǔn)正態(tài)分布的標(biāo)準(zhǔn)差
,由概率論知識可知在±3倍的標(biāo)準(zhǔn)差以外的
z
值是非常非常少的,大約只有
0.0027=0.27%,而現(xiàn)在我們得到的z=3.6,已經(jīng)超過了±3
倍的標(biāo)準(zhǔn)差以外,于是我們就有足夠的理由認(rèn)為
z=3.6
落入到圖
10-2
的陰影部分區(qū)域,從而
落入到圖
10-1
的陰影部分區(qū)域,我們有足夠的理由拒絕原假設(shè)。在這個(gè)過程中,我們是以z值進(jìn)行檢驗(yàn)的,其構(gòu)造方式由式(10-2)決定的,故稱其為檢驗(yàn)統(tǒng)計(jì)量。由于這個(gè)檢驗(yàn)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布,所以這個(gè)檢驗(yàn)統(tǒng)計(jì)量稱為
z檢驗(yàn)統(tǒng)計(jì)量。z檢驗(yàn)統(tǒng)計(jì)量的絕對值越大,表示
和
之間偏離越遠(yuǎn),拒絕原假設(shè)的理由越充分,反之,不拒絕原假設(shè)的理由越充分。
不同的假設(shè)檢驗(yàn)需要構(gòu)造相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。3.
拒絕域與顯著性水平由上段分析可知,我們可以用
z檢驗(yàn)統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn),基本方法是:如果
z檢驗(yàn)統(tǒng)計(jì)量的值落入到圖
10-2
的陰影部分區(qū)域則拒絕原假設(shè),否則不拒絕假設(shè)。所以圖
10-2
的陰影部分區(qū)域稱之為拒絕域,其含義是可以做出拒絕原假設(shè)決策的區(qū)域。拒絕域范圍是由什么因素決定的呢?由于標(biāo)準(zhǔn)正態(tài)分布是確定的,從圖
10-2
可以看出,拒絕域范圍是由我們設(shè)定的
的取值偏離
足夠遠(yuǎn)的概率
決定的。
的值越大(陰影部分的面積越大),拒絕域的范圍也越大;反之,拒絕域的范圍也越小。
稱為顯著性水平。統(tǒng)計(jì)上的“顯著”并不表示“重要”,而是代表這個(gè)結(jié)果是“非偶然的”。一般來說
的值由研究者主觀確定,
的值都很小,常用的取值有
0.10、0.05、0.01,也可以取其他的值。顯著性水平可以認(rèn)為是研究者拒絕原假設(shè)時(shí)所要承擔(dān)的風(fēng)險(xiǎn),即原假設(shè)為真,但卻做出了拒絕原假設(shè)的決策。因?yàn)槲覀兪且罁?jù)樣本信息做出決策的,而樣本是有偶然性,并不能保證
100%的正確,如果取
0.05
,就意味著研究者拒絕原假設(shè)時(shí)所要承擔(dān)的風(fēng)險(xiǎn)最高不超過
0.05,那么1
0.95
就是可靠水平,稱為置信水平。由圖
10-2可見顯著性水平越小,結(jié)論的可靠性越大。怎樣構(gòu)造拒絕域呢?由于拒絕域是由標(biāo)準(zhǔn)正態(tài)分布以及顯著性水平
確定的,構(gòu)造拒絕域的關(guān)鍵是要確定如圖
10-2
中陰影部分的臨界值。記這個(gè)臨界值為
,由概率論知識可知,可以通過查標(biāo)準(zhǔn)正態(tài)分布表得到
。如果取
0.05
,則
Z
0.025
1.96
,故雙側(cè)檢驗(yàn)的拒絕域?yàn)椋?∞,-1.96),(1.96,+∞),如圖
10-3a)所示。如果是單側(cè)檢驗(yàn),則要分左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)。在例
10-3
中,只有當(dāng)樣本足夠小時(shí)才能拒絕原假設(shè),所以其拒絕域在左側(cè),是左側(cè)檢驗(yàn)。如果取
0.05
,查表得Z
Z
0.05
1.64
,故左側(cè)檢驗(yàn)的臨界值為-1.64,拒絕域?yàn)椋?∞,-1.64),如圖
10-3b)所示。同理,右側(cè)檢驗(yàn)的拒絕域?yàn)椋?.64,+∞),如圖
10-3c)所示。a)雙側(cè)檢驗(yàn)b)左側(cè)檢驗(yàn)c)右側(cè)檢驗(yàn)4.決策規(guī)則
由上面的分析可以看出,我們是依據(jù)樣本統(tǒng)計(jì)量與假定為真的參數(shù)取值(原假設(shè))之間的差異來判斷是否能拒絕原假設(shè)的。這種差異的本質(zhì)是一種誤差,形成這種誤差的原因有兩個(gè):一是隨機(jī)原因,這是由樣本的隨機(jī)性形成的,稱之為隨機(jī)性誤差;二是系統(tǒng)原因,這是由我們假定參數(shù)的取值為真(原假設(shè)為真)形成的,稱之為系統(tǒng)性誤差,其含義是參數(shù)真實(shí)的取值不是我們假定的哪個(gè)值。
直觀的理解,如果樣本統(tǒng)計(jì)量的值偏離假定為真的參數(shù)取值越“遠(yuǎn)”,則這種誤差是系統(tǒng)性誤差的可能性越大,我們拒絕原假設(shè)的理由就越充分;反之,則不能拒絕原假設(shè)。
判斷樣本統(tǒng)計(jì)量的值離假定為真的參數(shù)的取值“遠(yuǎn)”需要用檢驗(yàn)統(tǒng)計(jì)量,由于條件不同,檢驗(yàn)統(tǒng)計(jì)量的分布也不同,在上段中我們確定的檢驗(yàn)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布,即
z
檢驗(yàn)統(tǒng)計(jì)量。由樣本為統(tǒng)計(jì)量的值可計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的值,如果檢驗(yàn)統(tǒng)計(jì)量的值離
0過“遠(yuǎn)”,我們就可以認(rèn)為樣本統(tǒng)計(jì)量與假定為真的參數(shù)取值之間的誤差是系統(tǒng)性誤差,從而有足夠的理由拒絕原假設(shè)。以什么標(biāo)準(zhǔn)判斷“遠(yuǎn)”呢?這個(gè)標(biāo)準(zhǔn)就是拒絕域的臨界值。如果檢驗(yàn)統(tǒng)計(jì)量的值超過了臨界值,則說明已經(jīng)顯著的“遠(yuǎn)”了,或者說這種“遠(yuǎn)”是非偶然的(不是偶然原因形成的,或者說是顯著的),這時(shí)就有理由能拒絕原假設(shè)了。
這樣,我們可以歸納出假設(shè)檢驗(yàn)的決策規(guī)則,見表
10-2。表
10-2 z
檢驗(yàn)決策規(guī)則注:
為顯著性水平檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量與臨界值的比較決策結(jié)果雙側(cè)檢驗(yàn)拒絕原假設(shè)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)拒絕原假設(shè)右側(cè)檢驗(yàn)拒絕原假設(shè)
特別需要注意的是,如果不能做出拒絕原假設(shè)的決策時(shí),我們應(yīng)該表達(dá)為“不拒絕原假設(shè)”,而不應(yīng)該表達(dá)為“接受原假設(shè)”。這兩種表達(dá)形式是有本質(zhì)區(qū)別的,不拒絕原假設(shè)的含義是說還沒有足夠的證據(jù)證明原假設(shè)為假(并沒有認(rèn)定原假設(shè)一定為真),而接受原假設(shè)的含義是原假設(shè)為真。5.第Ⅰ類錯(cuò)誤與第Ⅱ類錯(cuò)誤
在假設(shè)檢驗(yàn)中,我們是依據(jù)樣本信息做出的決策。由于樣本具有偶然性,所以決策結(jié)果并不能保證
100%正確,或者說是可能犯錯(cuò)誤的。假設(shè)檢驗(yàn)中可能犯的錯(cuò)誤分為兩類:第Ⅰ類錯(cuò)誤與第Ⅱ類錯(cuò)誤。第Ⅰ類錯(cuò)誤也稱之為“拒真錯(cuò)誤”,是指原假設(shè)實(shí)際上為真,但卻被錯(cuò)誤的拒絕了;第Ⅱ類錯(cuò)誤也稱之為“存?zhèn)五e(cuò)誤”,是指原假設(shè)實(shí)際為假,但卻沒有拒絕它。假設(shè)檢驗(yàn)中可能出現(xiàn)四種不同的結(jié)果,歸納起來如表
10-3
所示。表
10-3
假設(shè)檢驗(yàn)中的四種結(jié)果不拒絕原假設(shè)拒絕原假設(shè)原假設(shè)實(shí)際為真結(jié)論正確結(jié)論錯(cuò)誤Ⅰ(拒真)原假設(shè)實(shí)際為假結(jié)論錯(cuò)誤Ⅱ(存?zhèn)危┙Y(jié)論正確
人們經(jīng)過比較認(rèn)為犯第Ⅰ類錯(cuò)誤的后果要比犯第Ⅱ類錯(cuò)誤的后果嚴(yán)重。第Ⅰ類錯(cuò)誤的后果好比一個(gè)人是清白的(原假設(shè)為真),但卻被判其有罪(拒絕原假設(shè));第Ⅱ類錯(cuò)誤的后果好比一個(gè)人有罪(原假設(shè)為假),但卻被判無罪釋放(不拒絕原假設(shè))。冤枉一個(gè)好人的后果顯然要比放過一個(gè)壞人的后果要嚴(yán)重的多,因?yàn)橐坏┯凶C據(jù)還是可以將壞人繩之以法的,所以人們總想辦法來控制犯第Ⅰ類錯(cuò)誤的可能性。
犯第Ⅰ類錯(cuò)誤是這樣的情形發(fā)生了:雖然原假設(shè)為真,但檢驗(yàn)統(tǒng)計(jì)量的值卻落入到拒絕域,從而做出了拒絕原假設(shè)的決策。因?yàn)榫芙^域?qū)?yīng)的概率為
,所以犯第Ⅰ類錯(cuò)誤的可能性就是顯著性水平
,所以一般做假設(shè)檢驗(yàn)時(shí),人們都會(huì)將
假定的比較?。ㄐ「怕剩?,目的之一就是要控制犯第Ⅰ類錯(cuò)誤的可能性。我們將犯第Ⅱ類錯(cuò)誤的可能性記為
,控制和計(jì)算
比較復(fù)雜。
于是,很多人就會(huì)有這樣一個(gè)想法,能不能同時(shí)使
和
都???這個(gè)愿望是無法實(shí)現(xiàn)的,這是因?yàn)檫@兩種可能性是一個(gè)此消彼長的關(guān)系,我們以單側(cè)檢驗(yàn)繪制一張示意圖來說明兩者之間的關(guān)系,如圖
10-4。
假設(shè)問題是一個(gè)右側(cè)檢驗(yàn):
H
0
:
0,
H1
:
0。如果檢驗(yàn)統(tǒng)計(jì)量的值沒有落入拒絕域(
的面積,圖
10-4
的上側(cè)),且原假設(shè)不正確,那么第Ⅱ類錯(cuò)誤就發(fā)生了。由于原假設(shè)不正確,故真實(shí)的
0要比原來假設(shè)的
0大,如圖
10-4
的下側(cè),顯然第Ⅱ類錯(cuò)誤發(fā)生的概率是除去
的部分,如果減少
的面積,則會(huì)增加
的面積。圖
10-4
與
的關(guān)系所以我們一般是事先設(shè)定一個(gè)較小的
。10.2一個(gè)總體的參數(shù)檢驗(yàn)
本節(jié)將具體討論對三種總體參數(shù)的檢驗(yàn),分別是總體均值
、總體比率
和總體方差
2
。上一節(jié)中的各種概念和方法都會(huì)在本節(jié)內(nèi)容中出現(xiàn),但由于檢驗(yàn)的參數(shù)不同,構(gòu)造檢驗(yàn)統(tǒng)計(jì)量的方法也不同。10.2.1
總體均值的假設(shè)檢驗(yàn)1.大樣本、總體方差已知在這個(gè)條件下,由中心極限定理可知,樣本均值服從正態(tài)分布,故我們可以構(gòu)造z
檢驗(yàn)統(tǒng)計(jì)量。(10-4)式中
——樣本均值;μ—-假設(shè)的總體均值
——總體標(biāo)準(zhǔn)差;n—-樣本容量【例
10-4】某果汁飲料包裝容量為
500ml/盒,為了判斷罐裝生產(chǎn)線生產(chǎn)是否正常,質(zhì)檢人員需要定期抽樣檢測容量。假如某天質(zhì)檢人員抽取
64
盒果汁飲料時(shí)行檢測,得到平均容量為
505ml/盒,總體標(biāo)準(zhǔn)差
15
,這時(shí)罐裝生產(chǎn)線工作是否正常?(取
0.05
)解:已知:n=64,
,
15
,
0.05建立假設(shè)由于研究者是質(zhì)檢人員,他支持的觀點(diǎn)是生產(chǎn)線工作不正常,所以這個(gè)問題的假設(shè)是:H
0
:
500
,
H1
:
500選擇合適的檢驗(yàn)統(tǒng)計(jì)量由于是大樣本,總體方差已知,那么使用z
檢驗(yàn)。
3)在本例中
0.05
,查表得
,故拒絕域?yàn)椋?∞,-1.96),(1.96,+∞)。4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值
由于
,故拒絕原假設(shè)。說明有足夠的證據(jù)證明這時(shí)生產(chǎn)線的生產(chǎn)是不正常的,罐裝量比標(biāo)準(zhǔn)值偏高(檢驗(yàn)統(tǒng)計(jì)量的值為正)。本例題結(jié)果的示意圖如下:圖
10-5
Z
分布及臨界值Z
分布【例
10-5】在例
10-4
中,如果將研究者換成工商管理人員,抽查了
64
盒這種果汁飲料進(jìn)行檢測,得到平均容量為
498
ml/盒,總體標(biāo)準(zhǔn)差
15
,在
0.05
水平下,工商管理人員將做出怎樣的判斷?解:已知:n=64,
,
15
,
0.05因?yàn)楣ど坦芾砣藛T支持的觀點(diǎn)是生產(chǎn)廠商可能有少罐裝的嫌疑,故這時(shí)的假設(shè)形式為:H
0
:
500
,
H1
:
500
這是一個(gè)單側(cè)檢驗(yàn)中的左側(cè)檢驗(yàn),拒絕域在左側(cè)。
0.05
時(shí)有,故拒絕域?yàn)椋?∞,-1.64)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:
由于
z
1.067
Z
0.05
1.64
,z=-1.067
沒有落入拒絕域,故不拒絕原假設(shè),沒有足夠的理由證明生產(chǎn)廠商有少罐裝的行為。左側(cè)檢驗(yàn)的結(jié)果示意圖如下:圖
10-6
左側(cè)檢驗(yàn)
在上面的檢驗(yàn)中是采用比較檢驗(yàn)統(tǒng)計(jì)量的值與臨界值的方法,這種方法稱為臨界值法,是假設(shè)時(shí)經(jīng)常用到的方法。除此以外,還可以用
p
值方法進(jìn)行假設(shè)檢驗(yàn)。
在之前的方法中,顯著性水平是在檢驗(yàn)之前就確定的,這就意味著事先確定了拒絕域,使我們有一個(gè)明確的取舍標(biāo)準(zhǔn)。但此方法不足的是,顯著性水平是犯第Ⅰ類錯(cuò)誤的上限,它只能提供檢驗(yàn)結(jié)果可靠性是否及格,對一個(gè)具體的檢驗(yàn)問題,不能給出其可能性的精確度量。
p
值是利用檢驗(yàn)統(tǒng)計(jì)量的值計(jì)算出的一個(gè)概率值,雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)的
p
值有所區(qū)別,通俗的講,p
值是檢驗(yàn)統(tǒng)計(jì)量的值與拒絕域方向相同的外側(cè)面積,我們以
z
檢驗(yàn)為例繪制
p
值的示意圖,如圖
10-7
所示。a)雙側(cè)檢驗(yàn)b)左側(cè)檢驗(yàn)c)右側(cè)檢驗(yàn)圖
10-7
假設(shè)檢驗(yàn)的
p
值
雙側(cè)檢驗(yàn)的
p
值在兩側(cè),而單側(cè)檢驗(yàn)中的左側(cè)檢驗(yàn)
p
值在左側(cè),右側(cè)檢驗(yàn)
p
值在右側(cè)。
由圖
10-7
可以看出,
p
值越小則說明樣本統(tǒng)計(jì)量與總體參數(shù)越不一致,越不利于原假設(shè)。如果計(jì)算得到
p
,則說明
p
值的臨界值(檢驗(yàn)統(tǒng)計(jì)量的值)落入拒絕域,故拒絕原假設(shè),否則不拒絕。
Z
分布的
p
值可以用Excel
計(jì)算得到。首先計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,再利用NORM.S.DIST
函數(shù)計(jì)算出標(biāo)準(zhǔn)正態(tài)分布對應(yīng)的下側(cè)面積,從而可以計(jì)算出
p
值。在例
10-4
中,z=2.67,可以得到其下側(cè)面積為
0.999841,則其上側(cè)面積為
0.000159,故對應(yīng)的
p=0.000159×2=0.000318,如圖10-7a)。此時(shí)有
p=0.000318<
0.05
,故拒絕原假設(shè)。
在例
10-5
中,由于
z=-1.067,這時(shí)要計(jì)算
z=1.067
上側(cè)的面積(因?yàn)?/p>
z=1.067
上側(cè)面積與
z=-1.067
下側(cè)面積相等,而
NORM.S.DIST
函數(shù)只能計(jì)算正值的上側(cè)面積)。計(jì)算得到
p=0.142986,如圖
10-7b)。此時(shí)有
p=0.142986>
0.05
,故不拒絕原假設(shè)。表
10-4大樣本、總體方差已知條件下一個(gè)總體均值的檢驗(yàn)方法雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)檢驗(yàn)統(tǒng)計(jì)量拒絕域p值決策規(guī)則如果則拒絕H02.小樣本、總體方差已知
由于小樣本有更大的偶然性,需要承擔(dān)更大的風(fēng)險(xiǎn),所以在這個(gè)條件下需要增加一個(gè)條件:總體服從正態(tài)分布,這樣,檢驗(yàn)的方法與大樣本時(shí)完全相同?!纠?/p>
10-6】某品牌汽車的生產(chǎn)商聲稱其生產(chǎn)的一款
2.0L
排量的自動(dòng)檔轎車的油耗不超過
8L/100km。為了證實(shí)這個(gè)說法,一家汽車俱樂部對該款車進(jìn)行了調(diào)查,由抽取的
16
輛車計(jì)算得到的平均油耗是8.9
L/100km,假設(shè)總體服從正態(tài)分布,總體標(biāo)準(zhǔn)差
1.5
L/100km,顯著性水平
0.05
,這些數(shù)據(jù)能支持汽車生產(chǎn)商的說法嗎?解:已知:n=16,
,
1.5
,
0.05由于研究者是汽車俱樂部,故他們支持的觀點(diǎn)是這款轎車的油耗要大于
8L/100km,故:H
0
:
8
,
H1
:
8由于總體服從正態(tài)分布,在小樣本、總體方差已知的條件下,仍然使用
z
檢驗(yàn)。查表得:
Z
Z
0.05
1.64
,拒絕域?yàn)椋?.64,+∞)。計(jì)算檢驗(yàn)統(tǒng)計(jì)的值得:
由于z
2.4
Z
0.05
1.64
,檢驗(yàn)統(tǒng)計(jì)量的值落入到拒絕域,故拒絕原假設(shè),汽車生產(chǎn)商說法不能成立。
如果使用
p
值方法,則要計(jì)算
z=2.4
對應(yīng)的
p
值。由
Excel
計(jì)算得
p=0.008198,則有
p=0.008198<
0.05
,故同樣拒絕原假設(shè)。檢驗(yàn)結(jié)果如圖
10-8
所示。圖
10-8
汽車油耗的假設(shè)檢驗(yàn)3.大樣本、總體方差未知
總體方差是參數(shù),在實(shí)際問題中一般是未知的。在這樣的條件下,我們需要用樣本標(biāo)準(zhǔn)差
s
來代替總體標(biāo)準(zhǔn)差
。這時(shí),經(jīng)過標(biāo)準(zhǔn)化變換的檢驗(yàn)統(tǒng)計(jì)量不再服從標(biāo)準(zhǔn)正態(tài)分布了,而是服從自由度為(n-1)的
t
分布。故此時(shí)的檢驗(yàn)統(tǒng)計(jì)量稱為t
檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)也稱為
t
檢驗(yàn)。(10-5)式中
—樣本均值s—樣本標(biāo)準(zhǔn)差n—樣本容量【例
10-7】國家電器產(chǎn)品安全質(zhì)量監(jiān)督檢驗(yàn)中心,是經(jīng)中國合格評定國家認(rèn)可委員會(huì)(CNAS)認(rèn)可的國家級實(shí)驗(yàn)室、國際電工委員會(huì)電工產(chǎn)品及元件合格評定組織(IECEE)認(rèn)可的國際CB
實(shí)驗(yàn)室、中國國家認(rèn)證認(rèn)可監(jiān)督管理委員會(huì)(CNCA)指定的國家強(qiáng)制性產(chǎn)品認(rèn)證(CCC)檢測實(shí)驗(yàn)室,是中國質(zhì)量認(rèn)證中心(CQC)、廣東質(zhì)檢中誠認(rèn)證有限公司(CTC)等認(rèn)證機(jī)構(gòu)簽約的CCC
認(rèn)證檢驗(yàn)和自愿認(rèn)證檢驗(yàn)實(shí)驗(yàn)室,工業(yè)產(chǎn)品生產(chǎn)許可證檢驗(yàn)實(shí)驗(yàn)室,也是中國能效標(biāo)識中心備案的能效標(biāo)識能源效率檢測實(shí)驗(yàn)室。
受某冰箱生產(chǎn)企業(yè)的委托,對其生產(chǎn)的型號為
BCD-216SDX
冰箱進(jìn)行檢測,其中一項(xiàng)是對冰箱的耗電量進(jìn)行檢測,這款冰箱標(biāo)注的耗電量是
24
小時(shí)
0.58
千瓦時(shí)。假設(shè)抽檢了
36
臺(tái)此款冰箱,得到
24小時(shí)耗電量的數(shù)據(jù)(數(shù)據(jù)見
Data10-1),如果取
0.05
這些數(shù)據(jù)能支持生產(chǎn)商的說法嗎?解:由樣本數(shù)據(jù)計(jì)算得:
X
0.63
,
s
0.16
,且n=36,
0.05
。
作為第三方檢測機(jī)構(gòu),其應(yīng)該站在保護(hù)消費(fèi)者的立場上,故假設(shè)為:
H
0
:
0.58
,
H1
:
0.58
由于是大樣本,總體方差未知,故檢驗(yàn)統(tǒng)計(jì)量服從自由度為
35的
t
分布。查表得:
t
(n
1)
t0.05
(35)
1.69
,故拒絕域?yàn)椋?.69,+∞)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值得:由于t
1.875
t0.05
1.69
,故拒絕域原假設(shè),這些數(shù)據(jù)不支持生產(chǎn)商的說法,說明平均而言這款冰箱的
24
小時(shí)耗電量超過其標(biāo)注的0.58
千瓦時(shí)。如果用
p
值方法,過程如下:在Excel
中運(yùn)用TDIST
函數(shù)可得t=1.875
上側(cè)的面積
p=0.034578,由于
p=0.034578<
0.05
,故拒絕原假設(shè)。檢驗(yàn)的結(jié)果如下圖所示。圖
10-9
冰箱
24
小時(shí)耗電量的假設(shè)檢驗(yàn)4.小樣本、總體方差未知
當(dāng)小樣時(shí),與
z
檢驗(yàn)一樣要求總體服從正態(tài)分布,仍然使用
t檢驗(yàn)?!纠?/p>
10-8】某品牌手工速凍餃子包裝袋上標(biāo)注的凈含量為
500
克。為了簡化包裝手續(xù),生產(chǎn)車間憑經(jīng)驗(yàn)認(rèn)為餃子速凍后的平均重量為20
克,所以決定每袋裝
25
個(gè)餃子。質(zhì)檢部門在生產(chǎn)線上隨機(jī)抽取了
25
個(gè)餃子,在速凍的狀態(tài)下稱得重量(數(shù)據(jù)見
Data10-2),假設(shè)總體服從正態(tài)分布,顯著性水平設(shè)為
0.05,質(zhì)檢部門能從這些數(shù)據(jù)和計(jì)算結(jié)果中可以得到怎樣的結(jié)論?解:由樣本數(shù)據(jù)計(jì)算得:
,s=1.8,且n=25,
0.05
。
研究者是質(zhì)檢部門,支持的觀點(diǎn)是餃子的平均重量不是
20
克,故假設(shè)為:
H
0
:
20
,
H1
:
20
由于總體服從正態(tài)分布,在小樣本、總體方差未知的條件下,仍然使用
t
檢驗(yàn)。查表得:
t
2
(n
1)
t0.025
(24)
2.06
,故拒絕域?yàn)椋?∞,-2.06),(2.06,+∞)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:
由于
,故拒絕原假設(shè),說明這時(shí)生產(chǎn)的速凍餃子的重要平均不足
20
克,如果每袋裝
25
個(gè)餃子,總重量會(huì)低于
500克(檢驗(yàn)統(tǒng)計(jì)量的值為負(fù))。
如果用
p
值方法,過程如下:
在
Excel
中運(yùn)用
TDIST
函數(shù)可得
t=2.5
雙側(cè)的面積
p=0.019654,由于
p=0.019654<
0.05
,故拒絕原假設(shè)。檢驗(yàn)的結(jié)果如下圖所示。圖
10-10
速凍餃子重量的假設(shè)檢驗(yàn)表
10-5
總體方差未知條件下一個(gè)總體均值的檢驗(yàn)方法
由上述過程我們可以歸納出假設(shè)檢驗(yàn)的一般方法和邏輯關(guān)系:首先假定原假設(shè)為真(反證法);在原假設(shè)為真的前提下,檢驗(yàn)統(tǒng)計(jì)量服從某種分布(中心極限定理);如果原假設(shè)為真,則由樣本計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量的值不會(huì)落入到小概率區(qū)域(拒絕域)。若檢驗(yàn)統(tǒng)計(jì)量的值落入到小概率區(qū)域,則有理由認(rèn)為原假設(shè)不為真(小概率原理)。10.2.2
一個(gè)總體比率的假設(shè)檢驗(yàn)
當(dāng)數(shù)據(jù)以定性的方式表示時(shí),就涉及到數(shù)據(jù)分析中的比率問題。例如市場研究人員想知道產(chǎn)品消費(fèi)者中女性的比率是否上升,制造車間的質(zhì)量控制人員想確定次品率是否符合要求等等。通常用字母
表示總體比率,用p
表示樣本比率。
總體比率的假設(shè)檢驗(yàn)同樣有雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn),檢驗(yàn)的方法與總體均值的檢驗(yàn)方法相同,有臨界值法和p值方法,但檢驗(yàn)統(tǒng)計(jì)量的形式有所區(qū)別。
由中心極限定理可知,從兩項(xiàng)分布總體中進(jìn)行隨機(jī)抽樣,當(dāng)樣本容量很大時(shí),其樣本比率
p
近似服從正態(tài)分布,所以總體比率也能進(jìn)行和總體均值類似的假設(shè)檢驗(yàn),我們使用的是
z
檢驗(yàn),要注意使用這種方法的前提是大樣本,此時(shí)大樣本標(biāo)準(zhǔn)是以下兩個(gè)條件需同時(shí)成立:
n
5
及
n(1
)
5
,或者參考表
8-5
中的經(jīng)驗(yàn)值。一個(gè)總體比率的z
檢驗(yàn)統(tǒng)計(jì)量為(10-6)式中
p
——樣本比率;
n
——樣本容量?!纠?/p>
10-9】
某購物網(wǎng)站的管理層認(rèn)為在其網(wǎng)站上網(wǎng)購的客戶超過75%為女性。為了證實(shí)這個(gè)推測,網(wǎng)站的營銷部門做一次專門調(diào)查。營銷部門隨機(jī)抽取了
400
位客戶進(jìn)行調(diào)查,其中
280
位客戶是女性,設(shè)
0.05
,這些數(shù)據(jù)支持管理層的推測嗎?解:已知:n=400,
0.05
,由樣本數(shù)據(jù)可計(jì)算得:營銷部門支持的觀點(diǎn)是女性客戶不會(huì)超過75%,故:H
0
:
75%
,
H1
:
75%由于n=400,顯然是大樣本,檢驗(yàn)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布,故用
z
檢驗(yàn)。查表得:Z
Z
0.05
1.64
,由于是左側(cè)檢驗(yàn),所以拒絕域?yàn)椋?∞,-1.64)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值得:由于z=-2.31<
Z
0.05
1.64
,檢驗(yàn)統(tǒng)計(jì)量的值落入到拒絕域,故拒絕原假設(shè),在該網(wǎng)站網(wǎng)購的客戶中女性不超過
75%。
如果用
p
值方法,過程如下:
在Excel
中,運(yùn)用
NORM.S.DIST
函數(shù)計(jì)算
z=2.31
上側(cè)的面積,可得
p=0.0104444,因?yàn)?/p>
p=0.010444<
0.05
,故拒絕原假設(shè)。檢驗(yàn)的結(jié)果如下圖所示。圖
10-11
網(wǎng)購客戶為女性的比率假設(shè)檢驗(yàn)表
10-6
一個(gè)總體比率的檢驗(yàn)方法10.2.3
一個(gè)總體方差的假設(shè)檢驗(yàn)
研究人員經(jīng)常需要對總體的方差進(jìn)行假設(shè)檢驗(yàn),例如在零件制造中,質(zhì)量控制人員不僅需要了解其平均質(zhì)量是否達(dá)標(biāo),還要了解其質(zhì)量變動(dòng)情況。因?yàn)橐唤M數(shù)據(jù)的方差越大,那么其均值的代表性就越差,說明其質(zhì)量越不穩(wěn)定,所以對方差的檢驗(yàn)是相當(dāng)重要的。從前面的章節(jié)知識我們知道樣本方差可以用來估計(jì)總體方差,在總體服從正態(tài)分布的假定前提下,可以利用卡方分布來進(jìn)行假設(shè)檢驗(yàn)。
2
檢驗(yàn)統(tǒng)計(jì)量公式如下:(10-7)式中 s2
——樣本方差;
n
——樣本容量。
一個(gè)總體方差的假設(shè)檢驗(yàn)有雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn),同樣有臨界值法和
p值方法?!纠?/p>
10-10】一條藥品自動(dòng)生產(chǎn)線的質(zhì)量標(biāo)準(zhǔn)規(guī)定灌裝的劑量方差不超過
0.25。生產(chǎn)線經(jīng)過檢修后重新投入生產(chǎn),質(zhì)檢人員抽取了
25袋進(jìn)行檢測(數(shù)據(jù)見
Data10-3),假定總體服從正態(tài)分布,顯著性水平
0.05
,根據(jù)這些數(shù)據(jù)質(zhì)檢人員能做出怎樣的判斷?解:由樣本數(shù)據(jù)計(jì)算得:
s
2
0.136
,且n=25,
0.05
質(zhì)檢人員支持的觀點(diǎn)是經(jīng)常檢修后,生產(chǎn)線灌裝的劑量方差發(fā)生了改變,故:
H0:
0.25,H1:
0.25
由于樣本方差服從卡方分布,
自由度為
24
,
查表得:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:由于,檢驗(yàn)統(tǒng)計(jì)量的值沒有落入拒絕域,故不拒絕原假設(shè),說明沒有足夠的證據(jù)證明生產(chǎn)線灌裝的劑量方差發(fā)生了改變。
如果用
p
值方法,過程如下:
在
Excel
中,運(yùn)用
CHIDIST
函數(shù)計(jì)算得到
2
13.056
上側(cè)面積為0.965,下側(cè)面積為
0.035??ǚ诫p側(cè)檢驗(yàn)的
p
值等于較小的面積乘以
2,故
p=0.07>
0.05
,故不拒絕原假設(shè)。
質(zhì)檢人員支持的觀點(diǎn)也可以是生產(chǎn)線工作不正常,這時(shí)的假設(shè)為:
查表得:,故拒絕域?yàn)椋?6.415,+∞)。
由于,檢驗(yàn)統(tǒng)計(jì)量的值沒有落入拒絕域,故不拒絕原假設(shè),說明沒有足夠的證據(jù)證明生產(chǎn)線工作不正常。
如果用
p
值方法,過程如下:
在
Excel
中,運(yùn)用
CHIDIST
函數(shù)計(jì)算得到
2
13.056
上側(cè)面積為p=0.965。由于
p=0.965>
0.05
,故不拒絕原假設(shè)。檢驗(yàn)的結(jié)果如圖:a)雙側(cè)檢驗(yàn)b)單側(cè)檢驗(yàn)圖
10-12
藥品生產(chǎn)線方差的假設(shè)檢驗(yàn)表10-7一個(gè)總體方差的檢驗(yàn)方法10.3.兩個(gè)總體參數(shù)的檢驗(yàn)
在很多情況下,我們都需要在兩個(gè)總體之間進(jìn)行比較。例如兩個(gè)不同地區(qū)農(nóng)民平均純收入是不是有差異?男性與女性的消費(fèi)行為真的有差異嗎?兩只股票的風(fēng)險(xiǎn)有差異嗎?等等。這些問題的本質(zhì)就是比較兩個(gè)總體的均值、比率和方差。
在兩個(gè)總體之間進(jìn)行比較,需要在兩個(gè)總體中分別進(jìn)行抽樣,這兩個(gè)樣本可以是獨(dú)立樣本,也可以是匹配樣本,兩種樣本的判斷方法有所不同。我們先討論獨(dú)立樣本的情形。10.3.1
兩個(gè)總體均值之差的假設(shè)檢驗(yàn)1.大樣本、總體方差已知
如果兩個(gè)獨(dú)立樣本都是大樣本,并且兩個(gè)總體方差都已知,這是非常理想的一種情形。因?yàn)?,在這個(gè)條件下,由中心極限定理可知每個(gè)樣本均值分別服從正態(tài)分布,再由正態(tài)分布再生定理可知,兩個(gè)樣本均值之差也服從正態(tài)分布,故可用
z
檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量為:(10-8)式中
——樣本1的均值;——樣本2的均值;——樣本1的容量;——樣本2的容量;——總體1的均值;
——總體2的均值;——總體1的方差;——總體2的方差?!纠?/p>
10-11】據(jù)中新網(wǎng)消息,武漢軌道交通
2
號線南延線
19
日上午開通,并與軌道交通
2
號線、機(jī)場線貫通試運(yùn)營。至此,武漢地鐵運(yùn)營線路達(dá)
12
條,通車總里程
318
公里。2019
年武漢市政府工作報(bào)告提出,今年武漢市還將開通
8
號線三期、蔡甸線,開工建設(shè)新港線、12
號線三期、11
號線葛店段,同步推進(jìn)
10
條線路續(xù)建。根據(jù)規(guī)劃,到
2024
年武漢將形成總長
606公里的軌道網(wǎng)。(2019
年
02
月
19
日證券時(shí)報(bào)網(wǎng))隨著地鐵營運(yùn)里程的增加,武漢市交通的擁堵狀況得到大大緩解,上班族花在上班路上的時(shí)間有所減少。某報(bào)社記者為此專門做了調(diào)查,她查閱了兩年前的數(shù)據(jù),并與現(xiàn)在的數(shù)據(jù)進(jìn)行比較,假設(shè)
0.05
,通過這些數(shù)據(jù),記者能夠得到怎樣的結(jié)論?樣本
1:(兩年前)
,
n1
50
,
1
10樣本
2:(現(xiàn)在)
,
n2
54
,
2
9解:這是一個(gè)兩個(gè)總體均值比較的假設(shè)檢驗(yàn)。H
0
:
1
2
0
(兩年前后上班路上的時(shí)間沒有變化)H1
:
1
2
0
(兩年前后上班路上的時(shí)間有變化)由于兩個(gè)樣本都是大樣本,總體方差已知,故用z
檢驗(yàn)。查表得:
Z
/2
Z
0.025
1.96
,故拒絕域?yàn)椋?∞,-1.96),(1.96,+∞)。
計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:
由于
,說明檢驗(yàn)統(tǒng)計(jì)量的值落入到拒絕域,故拒絕原假設(shè)。這個(gè)結(jié)果說明兩年前后武漢的上班族花在上班路上的時(shí)間有顯著的變化,具體來說是兩年后花在路上的時(shí)間減少了(檢驗(yàn)統(tǒng)計(jì)的量為正)。
如果用
p
值方法,過程如下:
在Excel
中,運(yùn)用
NORM.S.DIST
函數(shù)計(jì)算
z=2.67
外側(cè)的面積,可得
p=0.007585,因?yàn)?/p>
p=0.007585<
0.05
,故拒絕原假設(shè)。檢驗(yàn)的結(jié)果如下圖所示:圖
10-13
假設(shè)檢驗(yàn)結(jié)果
這個(gè)問題也可以設(shè)置為其他形式的假設(shè)檢驗(yàn)。
單側(cè)檢驗(yàn)(右側(cè)檢驗(yàn)):
H
0
:
1
2
0
(兩年前后上班路上的時(shí)間沒有減少)
H1
:
1
2
0
(兩年前后上班路上的時(shí)間減少了)
由于右側(cè)檢驗(yàn)的拒絕域?yàn)椋?.64,+∞),而檢驗(yàn)統(tǒng)計(jì)量的值為z=2.67,落入到拒絕域,故拒絕原假設(shè),說明兩年前后上班路上的時(shí)間減少了。2.小樣本、總體方差已知
由于小樣本有更大的偶然性,需要承擔(dān)更大的風(fēng)險(xiǎn),所以在這個(gè)條件下需要增加一個(gè)條件:總體服從正態(tài)分布,這樣,檢驗(yàn)的方法與大樣本時(shí)完全相同?!纠?/p>
10-12】一家大型連鎖超市在中心城區(qū)和郊區(qū)都有門店,經(jīng)營者認(rèn)為在不同的地區(qū)消費(fèi)者的年齡有明顯的差異,應(yīng)該采取不同的營銷策略。為了證實(shí)這個(gè)判斷,經(jīng)營者在中心城區(qū)和郊區(qū)門店的消費(fèi)者中分別抽取了兩個(gè)樣本進(jìn)行比較,如果總體都服從正態(tài)分布,
0.05
,下列數(shù)據(jù)能支持經(jīng)營者的判斷嗎?樣本
1:(中心城區(qū))
,
n1
25
,
1
10樣本
2:(郊區(qū))
,
n2
18
,
2
9解:這是一個(gè)小樣本、總體方差已知的情況,因?yàn)榭傮w服從正態(tài)分布,故仍然用z
檢驗(yàn)。
經(jīng)營者支持的觀點(diǎn)是不同地區(qū)的消費(fèi)者年齡不同,故假設(shè)為:
H
0
:
1
2
0
,
H1
:
1
2
0
查表得:
Z
/2
Z
0.025
1.96
,故拒絕域?yàn)椋?∞,-1.96),(1.96,+∞)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:由于
,說明檢驗(yàn)統(tǒng)計(jì)量的值沒有落入到拒絕域,故不拒絕原假設(shè)。說明中心城區(qū)和郊區(qū)消費(fèi)者的年齡沒有顯著的差異。
如果用
p
值方法,過程如下:
在
Excel
中,運(yùn)用
NORM.S.DIST
函數(shù)計(jì)算z=1.715
外側(cè)的面積,可得
p=0.086345,因?yàn)?/p>
p=0.086345>
0.05
,故不拒絕原假設(shè)。
這個(gè)問題的另外一種形式可能更加合理,就是單側(cè)檢驗(yàn)。如果經(jīng)營者支持的觀點(diǎn)是中心城區(qū)消費(fèi)者的年齡比郊區(qū)的大,則假設(shè)為:
H
0
:
1
2
0
,
H1
:
1
2
0
則拒絕域?yàn)椋?.64,+∞)。檢驗(yàn)統(tǒng)計(jì)量的值仍然為
z=1.715,落入到拒絕域,故拒絕原假設(shè),說明中心城區(qū)消費(fèi)者的年齡要比郊區(qū)消費(fèi)者的年齡顯著的大。為什么數(shù)據(jù)相同,而假設(shè)不同,我們會(huì)得到了不同的結(jié)論呢?這是因?yàn)檠芯空邔︼L(fēng)險(xiǎn)方向判斷不同的結(jié)果,在右側(cè)檢驗(yàn)中,研究者將
(風(fēng)險(xiǎn)水平)都分配在右側(cè)(研究者認(rèn)為左側(cè)風(fēng)險(xiǎn)不會(huì)發(fā)生),這時(shí)拒絕域都在右側(cè),這時(shí)拒絕域的臨界值將變小,從而得到了不同的決策結(jié)果。3.大樣本、總體方差未知
在大部分情況下,總體方差是無法事先得到的,這時(shí)我們需要使用樣本方差來代替總體方差,在大樣本條件下,經(jīng)過標(biāo)準(zhǔn)化變換后,檢驗(yàn)統(tǒng)計(jì)量服從t
分布,故稱之為t
檢驗(yàn)。
但是,t
檢驗(yàn)的自由度的確定要分兩種情況。
1)
兩個(gè)總體方差相等在這個(gè)條件下,兩個(gè)總體數(shù)據(jù)分散程度是一樣的,故在兩個(gè)總體取樣的風(fēng)險(xiǎn)相對較小,這時(shí)檢驗(yàn)統(tǒng)計(jì)量為:式中——樣本1的均值;——總體1的均值——樣本2的均值;——總體2的均值——樣本1的容量;——樣本1的方差——樣本2的容量;——樣本2的方差
(10-9)其中稱為聯(lián)合方差估計(jì)。2)
兩個(gè)總體方差不相等
在這個(gè)條件下,兩個(gè)總體數(shù)據(jù)分散程度是不一樣的,故在兩個(gè)總體取樣的風(fēng)險(xiǎn)相對較大小,這時(shí)檢驗(yàn)統(tǒng)計(jì)量為:(10-10)
其中自由度為
[x]表示不超過
x
的最大整數(shù)。
可以證明:
也就是說,
我們可以用較小的自由度來對沖風(fēng)險(xiǎn)?!纠?/p>
10-13】
2017
年“學(xué)生體質(zhì)健康評價(jià)與運(yùn)動(dòng)干預(yù)”高峰論壇,今天在上海華東師范大學(xué)閉幕,論壇上,由華東師范大學(xué)“青少年健康評價(jià)與運(yùn)動(dòng)干預(yù)”教育部重點(diǎn)實(shí)驗(yàn)室與日本相關(guān)機(jī)構(gòu)合作研究發(fā)布的《中日兒童青少年體質(zhì)健康比較研究結(jié)果公報(bào)》受到關(guān)注。該項(xiàng)成果歷時(shí)3
年,分別在中國與日本的
4
個(gè)城市或地區(qū),對近兩萬名
7~18
歲的兒童青少年,運(yùn)用同樣的方法和標(biāo)準(zhǔn)進(jìn)行測試后完成。結(jié)果顯示,“2014
年和
2016
年,中國兒童青少年體格指標(biāo)(身高、體重和
BMI)大部分年齡段顯著高于日本;但體能指標(biāo)的比較中,日本兒童青少年在心肺耐力、柔韌性和靈敏協(xié)調(diào)性方面均顯著高于中國。”
(2018-10-28
搜狐健康)
假設(shè)該項(xiàng)目研究人員在中日兩國某一年齡組分別抽取了部分男生測試
50
米跑,測試數(shù)據(jù)如下。假定兩個(gè)總體的方差相等,
0.05
,在
50
米跑項(xiàng)目上中日兩國這個(gè)年齡組的男生存在顯著差異嗎?樣本
1:(中國)
(秒),n1
135
,
s1
1.1樣本
2:(日本)
(秒),n2
117
,s2
1.0解:由于研究者支持在這個(gè)項(xiàng)目上中國兒童的整體水平低于日本兒童的整體水平,故:H0:
1
2
0,H1:
1
2
0
這是一個(gè)大樣本、總體方差未知但相等的問題,故用
t
檢驗(yàn),自由度為
250。
在Excel
中使用
T.INV.2T
函數(shù)(注意是雙側(cè),故Probability
選項(xiàng)中要輸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025國考大興安嶺鐵路運(yùn)輸崗位行測預(yù)測卷及答案
- 城市排水系統(tǒng)智能化改造方案
- 2025國考沈陽市測繪地理崗位申論高頻考點(diǎn)及答案
- 支氣管擴(kuò)張癥伴焦慮抑郁狀態(tài)患者的中醫(yī)體質(zhì)分布特點(diǎn)及相關(guān)性研究
- 2025國考大慶市韓語翻譯崗位行測預(yù)測卷及答案
- 難點(diǎn)解析-人教版八年級上冊物理《機(jī)械運(yùn)動(dòng)》難點(diǎn)解析試卷(含答案解析)
- 2025國考鄂爾多斯市規(guī)劃設(shè)計(jì)崗位申論題庫含答案
- 難點(diǎn)詳解人教版八年級上冊物理聲現(xiàn)象《噪聲的危害和控制》綜合測評練習(xí)題(含答案解析)
- 一種具有動(dòng)態(tài)偏置的超低功耗LDO研究與設(shè)計(jì)
- 難點(diǎn)解析-人教版八年級上冊物理聲現(xiàn)象《聲音的產(chǎn)生與傳播》專題測試練習(xí)題(含答案解析)
- 高中音樂(必修)《音樂鑒賞》 (人音版)《家國情懷的民族樂派》格林卡與穆索爾斯基《荒山之夜》
- 金屬及合金的塑性變形
- 陜西省引漢濟(jì)渭三期工程環(huán)評報(bào)告
- 電子商務(wù)交易模式
- 漣源事業(yè)編招聘2022年考試《公共基礎(chǔ)知識》真題及答案解析【整理版】
- 《寶葫蘆的秘密》試題及答案
- 萬豪國際酒店委托管理合同
- 蘇科版七年級數(shù)學(xué)上冊全冊教學(xué)案
- 高中英語選擇性必修三 (7)Unit 3 Reading and Thinking
- 三年級英語上冊Unit4AgeandPhoneNumbersPartA教學(xué)設(shè)計(jì)與反思閩教版三起
- 奉化市產(chǎn)業(yè)轉(zhuǎn)型升級探討
評論
0/150
提交評論