《統(tǒng)計(jì)學(xué)》課件-第10章 假設(shè)檢驗(yàn)_第1頁
《統(tǒng)計(jì)學(xué)》課件-第10章 假設(shè)檢驗(yàn)_第2頁
《統(tǒng)計(jì)學(xué)》課件-第10章 假設(shè)檢驗(yàn)_第3頁
《統(tǒng)計(jì)學(xué)》課件-第10章 假設(shè)檢驗(yàn)_第4頁
《統(tǒng)計(jì)學(xué)》課件-第10章 假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩171頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

10

假設(shè)檢驗(yàn)【學(xué)習(xí)目標(biāo)】建立解假設(shè)檢驗(yàn)的基本概念,掌握假設(shè)檢驗(yàn)的基本原理;理解僅依靠樣本進(jìn)行決策的風(fēng)險(xiǎn);能運(yùn)用假設(shè)檢驗(yàn)解決各種實(shí)際問題;掌握用

p值方法進(jìn)行假設(shè)檢驗(yàn)。10.1概述10.1.1假設(shè)檢驗(yàn)在經(jīng)濟(jì)管理活動(dòng)中,人們需要對各種各樣的現(xiàn)象進(jìn)行判斷,以期做出正確的決策。但是,人們所面對的是往往是隨機(jī)現(xiàn)象,并且所掌握和信息也是有限的,于是就產(chǎn)生了這樣一個(gè)問題:怎樣利用較少的信息對總體現(xiàn)象進(jìn)行決策。下面我們通過一個(gè)例子來說明這個(gè)問題?!纠?/p>

10-1】全國政協(xié)委員馮丹龍建議:完善兒童用藥安全管理

3

3

日,全國政協(xié)委員、馮玉祥之孫女馮丹龍,在接受法制晚報(bào)·看法新聞?dòng)浾卟稍L時(shí)表示,今年她的建議是建立和完善兒童用藥法律法規(guī),同時(shí)加強(qiáng)對兒童藥品研發(fā)生產(chǎn)的監(jiān)管。馮丹龍認(rèn)為,兒童用藥,安全是重中之重。兒童作為一個(gè)特殊用藥群體,各器官發(fā)育未成熟,對藥品的用法用量有其特殊要求。目前,臨床上兒童用藥不當(dāng)方面均有不同程度的問題,需要及時(shí)改進(jìn)和提高。

據(jù)《半月談》雜志報(bào)道,中國兒童用藥不良反應(yīng)發(fā)生率為

12.9%,其中新生兒高達(dá)

24.4%,分別是成人的

2

倍和

4

倍。中國醫(yī)藥工業(yè)信息中心的數(shù)據(jù)顯示,全國藥品生產(chǎn)企業(yè)有

8000多家,其中專門生產(chǎn)兒童用藥的企業(yè)僅占

0.1%。在藥品臨床實(shí)驗(yàn)注冊項(xiàng)目中,國產(chǎn)藥品注冊信息達(dá)到

16

萬多條,其中兒童藥品僅有2000

多條。

目前,兒童給藥劑量多依據(jù)成人劑量,再通過體重?fù)Q算、體表面積換算、年齡換算等方法來確定?!皟和^非成人的‘微縮版’,具有其本身的生理特點(diǎn)。將成人藥酌減給兒童使用,缺乏科學(xué)依據(jù)和循證醫(yī)學(xué)證據(jù)?!焙幽鲜∪嗣襻t(yī)院兒科主任高麗表示。(北青網(wǎng)

2018-03-03)

生產(chǎn)兒童藥物劑量控制非常重要,劑量少了達(dá)不到治療效果,劑量大了可能出現(xiàn)不良反應(yīng)。在生產(chǎn)過程中,我們怎樣判斷兒童藥物的劑量是否合格呢?顯然,不可能將全部的藥物都進(jìn)行檢測,我們能做的只是檢測其中的一小部分。

假設(shè)一條生產(chǎn)兒童注射液的自動(dòng)生產(chǎn)線的標(biāo)準(zhǔn)劑量是每支

12ml,由于各種偶然因素的影響,生產(chǎn)過程中罐裝劑量可能會(huì)產(chǎn)生偏差,假設(shè)允許偏差為

0.5ml。如果某一天,質(zhì)檢檢測了

36

支,得到平均值為

12.3ml,這時(shí)生產(chǎn)線工作正常嗎?解:這個(gè)問題可以歸納為一個(gè)統(tǒng)計(jì)問題:

生產(chǎn)線生產(chǎn)正常時(shí)標(biāo)準(zhǔn)劑量為

12ml,即總體均值

12

;允許的偏差為

0.5ml,即總體的標(biāo)準(zhǔn)差

0.5

;抽取樣本容量為

36

的樣本,得到

。這時(shí),我們能否依據(jù)這個(gè)樣本信息判斷

12

還成立嗎?

這個(gè)問題我們有兩個(gè)選擇:

12(生產(chǎn)線工作正常)和

12(生產(chǎn)線工作不正常),在總體標(biāo)準(zhǔn)差

0.5

的條件下,抽取樣本容量為36

的樣本,已知的樣本信息是

。我們希望利用這個(gè)樣本信息來對上述兩個(gè)選擇做出決策。樣本均值是統(tǒng)計(jì)量,是隨機(jī)變量,而總體均值是參數(shù),是確定的值,我們的目的是利用統(tǒng)計(jì)量來對參數(shù)的取值做出判斷。一般地,利用樣本統(tǒng)計(jì)量對總體參數(shù)的取值做出決策的統(tǒng)計(jì)方法,稱為假設(shè)檢驗(yàn)。10.1.2.假設(shè)檢驗(yàn)的方法

一般來說,假設(shè)檢驗(yàn)可以分成四個(gè)步驟:1)建立假設(shè);2)確定檢驗(yàn)統(tǒng)計(jì)量以及分布;3)設(shè)定顯著性水平,確定臨界值和拒絕域;4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,做出決策。每個(gè)步驟的變化都會(huì)產(chǎn)生不同的假設(shè)檢驗(yàn),我們分步驟具體解釋假設(shè)檢驗(yàn)的基本概念和方法。1.假設(shè)

所謂假設(shè)就是某些對客觀事物特征的初始判斷或者說斷言;用統(tǒng)計(jì)語言表達(dá)就是對總體參數(shù)的取值所作的斷言。由于這些斷言成立的理由并不充分,所以有對這些斷言進(jìn)行檢驗(yàn)的要求。

例如,在例

10-1

中,我們需要經(jīng)常監(jiān)測生產(chǎn)線的工作狀態(tài)。雖然有嚴(yán)格的標(biāo)準(zhǔn)和先進(jìn)的生產(chǎn)線,但由于生產(chǎn)過程會(huì)受到各樣偶然因素的影響,罐裝劑量可能會(huì)偏離標(biāo)準(zhǔn)劑量。在這里

12(生產(chǎn)線工作正常)就是一個(gè)假設(shè)(斷言),但是這個(gè)假設(shè)不一定成立,即可能出現(xiàn)另外一種情況:

12

(生產(chǎn)線工作不正常),如果是這種情況則需要對生產(chǎn)線的生產(chǎn)狀態(tài)進(jìn)行檢修。假設(shè)包括原假設(shè)和備擇假設(shè)。原假設(shè)記為H

0

,是研究者懷疑的、反對的,而且是要被檢驗(yàn)的假設(shè)。在例

10-1

中,H

0

:

12

就是原假設(shè),質(zhì)檢人員(研究者)之所以進(jìn)行檢測,就是懷疑生產(chǎn)線工作不正常,檢測的目的就是在判斷

12

是否成立。備擇假設(shè)記為

H1

,是研究者支持的假設(shè)。在例

10-1

中,H1

:

12

就是備擇假設(shè),是質(zhì)檢人員(研究者)之所以進(jìn)行檢測,就是支持

12

。原假設(shè)和備擇假設(shè)構(gòu)成完備事件組,非此既彼,不存在第三種情況。假設(shè)檢驗(yàn)的目的就是搜集證據(jù)反對(檢驗(yàn))原假設(shè),如果沒有足夠的證據(jù)拒絕原假設(shè),則只能選擇其反面—不拒絕原假設(shè)。

為了進(jìn)行假設(shè)檢驗(yàn),首要步驟就是建立假設(shè)。一般情況下先建立備擇假設(shè),這是因?yàn)閭鋼窦僭O(shè)是研究者支持的假設(shè),一般觀點(diǎn)明確,容易表達(dá)。當(dāng)備擇假設(shè)確定后,其對立事件就是原假設(shè)?!纠?/p>

10-2】某果汁飲料包裝容量為

500ml/盒,灌裝過多或過少都會(huì)被認(rèn)為包裝的容量不合格。質(zhì)檢人員需要定期抽樣檢測容量,判斷灌裝生產(chǎn)線生產(chǎn)是否正常,試建立對應(yīng)的假設(shè)。解:這個(gè)問題中質(zhì)檢人員是研究者,他支持的觀點(diǎn)是生產(chǎn)線生產(chǎn)不正常,否則他就不需要進(jìn)行檢測了。由于灌裝過多或過少都會(huì)被認(rèn)為不正常,故備擇假設(shè)為:H1

:

500,從而原假設(shè)為:H

0

:

500

?!纠?/p>

10-3】某品牌汽車輪胎的生產(chǎn)商聲稱其生產(chǎn)的輪胎行駛里程不少于

80000km。

為了驗(yàn)證這個(gè)說法,某汽車俱樂部對該品牌輪胎的行駛里程進(jìn)行抽樣調(diào)查,試建立對應(yīng)的假設(shè)。解:這個(gè)問題中汽車俱樂部是研究者,他支持的觀點(diǎn)是該品牌輪胎的行駛里程達(dá)不到

80000km,否則他就不會(huì)進(jìn)行抽樣調(diào)查。由于他支持的觀點(diǎn)是該品牌輪胎的行駛里程達(dá)不到

80000km,故備擇假設(shè)為:

H1

:

80000

,從而原假設(shè)為:

H

0

:

80000

。

由上述兩個(gè)例子可以看出建立假設(shè)的一些特點(diǎn):1)假設(shè)有不同的方向性。在例

10-2

中,樣本統(tǒng)計(jì)量的值比

500

過大或過?。p側(cè)),都有一定的理由拒絕H

0

:

500

,這樣的檢驗(yàn)稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn);在例

10-3

中,樣本統(tǒng)計(jì)量的值只有比

80000過?。▎蝹?cè))才有一定理由拒絕H

0

:

80000

,這樣的檢驗(yàn)稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)。表

10-1

總體均值假設(shè)檢驗(yàn)的基本形式

設(shè)

為總體均值,

0為假設(shè)的總體均值的取值,我們可以將假設(shè)的基本形式總結(jié)如表

10-1

所示的形式。假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)

備擇假設(shè)

假設(shè)的方向性與具體的問題有關(guān),也與研究者的地位有關(guān),因?yàn)椴煌匚坏难芯空邥?huì)有不同的觀點(diǎn)。如在例

10-2中,如果研究者換成工商管理人員,他可能更關(guān)心的是果汁生產(chǎn)廠商是否對消費(fèi)者有欺詐行為,也就是H1

:

500

,這時(shí)就有H

0

:

500

,這是一個(gè)單側(cè)檢驗(yàn)中的左側(cè)檢驗(yàn)。2)假設(shè)中所有的等號“=”設(shè)置在原假設(shè)中。包括“=”、“≤”、“≥”都設(shè)置在原假設(shè)中,這是因?yàn)榧僭O(shè)檢驗(yàn)是目的是檢驗(yàn)原假設(shè),而且在邏輯方法是反證法—先假設(shè)原假設(shè)為真,再試圖導(dǎo)出矛盾的結(jié)果,這樣就要求原假設(shè)要“明確”地包含所有要檢驗(yàn)的情況。3)上述例子中只涉及到總體均值的假設(shè),類似的可以建立總體比率、總體方差的假設(shè),同樣有雙側(cè)和單側(cè)檢驗(yàn)。2.檢驗(yàn)統(tǒng)計(jì)量

對不同的總體參數(shù)進(jìn)行檢驗(yàn),需要用到不同的樣本統(tǒng)計(jì)量。如對總體均值進(jìn)行檢驗(yàn),需要用到樣本均值;對總體比率進(jìn)行檢驗(yàn),需要用到樣本比率;對總體方差進(jìn)行檢驗(yàn),需要用到樣本方差等等。但是,樣本統(tǒng)計(jì)量并不能很好地幫助我們做出判斷,進(jìn)行參數(shù)的假設(shè)檢驗(yàn)需要構(gòu)造檢驗(yàn)統(tǒng)計(jì)量。

我們以例

10-1

來說明。生產(chǎn)線生產(chǎn)正常時(shí)標(biāo)準(zhǔn)劑量為12ml,即總體均值

12

;允許的偏差為0.5ml,即總體的標(biāo)準(zhǔn)差

0.5

;抽取樣本容量為36

的樣本,得到

。這時(shí),我們能否依據(jù)這個(gè)樣本信息判斷

12

還成立嗎?

這個(gè)問題要對下列假設(shè)進(jìn)行檢驗(yàn):

H

0

:

12

,

H1

:

12

。

顯然,樣本統(tǒng)計(jì)量

偏離總體均值

越遠(yuǎn),我們拒絕原假設(shè)的理由就越充分?,F(xiàn)在我們得到的樣本統(tǒng)計(jì)量

,這個(gè)值偏離

12

足夠遠(yuǎn)嗎?雖然絕對差異只有

0.3,但是這是

36

支的平均差異,因?yàn)檎`差有正有負(fù),可以互相抵消,0.3

可能是一個(gè)很大的差異。為此,我們要構(gòu)造檢驗(yàn)統(tǒng)計(jì)量進(jìn)行判斷。

我們先假定原假設(shè)為真,即

12

。由于樣本容量為

36(大樣本),

0.5

(總體方差已知),由中心極限定理得:(10-1)

由于

服從正態(tài)分布,在

12

為真的假定條件下,的取值偏離

12

足夠遠(yuǎn)的概率是非常小的,所以我們可以用概率來表示

偏離

12

的程度。設(shè)

的取值偏離

12

足夠遠(yuǎn)的概率為

,在雙側(cè)檢驗(yàn)中

相對于

12

的偏離可以是正偏離,也可以負(fù)偏離,所以

被平分在兩側(cè),單側(cè)面積為

,如圖

10-1

所示。于是我們就可以有一個(gè)直觀的判斷:如果

的值落入圖

10-1

中的陰影部分區(qū)域,

的值就偏離

12

足夠遠(yuǎn),就有足夠的理由拒絕原假設(shè),否則不拒絕原假設(shè)。圖

10-1

樣本均值的分布

現(xiàn)在得到的

,這個(gè)值落入到如圖

10-1

所示的陰影部分區(qū)域了嗎?從絕對差異顯然是不好判斷的,為此我們做標(biāo)準(zhǔn)化變換:(10-2)

的抽樣分布變換為標(biāo)準(zhǔn)正態(tài)分布,如圖

10-2

所示。經(jīng)過標(biāo)準(zhǔn)化變換后,將

12

變換到

z=0,兩側(cè)陰影部分的面積不發(fā)生變化。圖

10-2

標(biāo)準(zhǔn)正態(tài)分布由公式(10-2)可以計(jì)算得:(10-3)

即標(biāo)準(zhǔn)化變換將

變換到了z=3.6。如果

z=3.6

偏離

0

足夠的遠(yuǎn),即落入到圖

10-2

的陰影部分區(qū)域,則

就一定落入到圖10-1

的陰影部分區(qū)域,這時(shí)

偏離

12

足夠的遠(yuǎn),我們就有足夠的理由拒絕原假設(shè)?,F(xiàn)在的問題是我們怎樣判斷

z=3.6

是否落入到圖

10-1

的陰影部分區(qū)域。

由于標(biāo)準(zhǔn)正態(tài)分布的標(biāo)準(zhǔn)差

,由概率論知識可知在±3倍的標(biāo)準(zhǔn)差以外的

z

值是非常非常少的,大約只有

0.0027=0.27%,而現(xiàn)在我們得到的z=3.6,已經(jīng)超過了±3

倍的標(biāo)準(zhǔn)差以外,于是我們就有足夠的理由認(rèn)為

z=3.6

落入到圖

10-2

的陰影部分區(qū)域,從而

落入到圖

10-1

的陰影部分區(qū)域,我們有足夠的理由拒絕原假設(shè)。在這個(gè)過程中,我們是以z值進(jìn)行檢驗(yàn)的,其構(gòu)造方式由式(10-2)決定的,故稱其為檢驗(yàn)統(tǒng)計(jì)量。由于這個(gè)檢驗(yàn)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布,所以這個(gè)檢驗(yàn)統(tǒng)計(jì)量稱為

z檢驗(yàn)統(tǒng)計(jì)量。z檢驗(yàn)統(tǒng)計(jì)量的絕對值越大,表示

之間偏離越遠(yuǎn),拒絕原假設(shè)的理由越充分,反之,不拒絕原假設(shè)的理由越充分。

不同的假設(shè)檢驗(yàn)需要構(gòu)造相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。3.

拒絕域與顯著性水平由上段分析可知,我們可以用

z檢驗(yàn)統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn),基本方法是:如果

z檢驗(yàn)統(tǒng)計(jì)量的值落入到圖

10-2

的陰影部分區(qū)域則拒絕原假設(shè),否則不拒絕假設(shè)。所以圖

10-2

的陰影部分區(qū)域稱之為拒絕域,其含義是可以做出拒絕原假設(shè)決策的區(qū)域。拒絕域范圍是由什么因素決定的呢?由于標(biāo)準(zhǔn)正態(tài)分布是確定的,從圖

10-2

可以看出,拒絕域范圍是由我們設(shè)定的

的取值偏離

足夠遠(yuǎn)的概率

決定的。

的值越大(陰影部分的面積越大),拒絕域的范圍也越大;反之,拒絕域的范圍也越小。

稱為顯著性水平。統(tǒng)計(jì)上的“顯著”并不表示“重要”,而是代表這個(gè)結(jié)果是“非偶然的”。一般來說

的值由研究者主觀確定,

的值都很小,常用的取值有

0.10、0.05、0.01,也可以取其他的值。顯著性水平可以認(rèn)為是研究者拒絕原假設(shè)時(shí)所要承擔(dān)的風(fēng)險(xiǎn),即原假設(shè)為真,但卻做出了拒絕原假設(shè)的決策。因?yàn)槲覀兪且罁?jù)樣本信息做出決策的,而樣本是有偶然性,并不能保證

100%的正確,如果取

0.05

,就意味著研究者拒絕原假設(shè)時(shí)所要承擔(dān)的風(fēng)險(xiǎn)最高不超過

0.05,那么1

0.95

就是可靠水平,稱為置信水平。由圖

10-2可見顯著性水平越小,結(jié)論的可靠性越大。怎樣構(gòu)造拒絕域呢?由于拒絕域是由標(biāo)準(zhǔn)正態(tài)分布以及顯著性水平

確定的,構(gòu)造拒絕域的關(guān)鍵是要確定如圖

10-2

中陰影部分的臨界值。記這個(gè)臨界值為

,由概率論知識可知,可以通過查標(biāo)準(zhǔn)正態(tài)分布表得到

。如果取

0.05

,則

Z

0.025

1.96

,故雙側(cè)檢驗(yàn)的拒絕域?yàn)椋?∞,-1.96),(1.96,+∞),如圖

10-3a)所示。如果是單側(cè)檢驗(yàn),則要分左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)。在例

10-3

中,只有當(dāng)樣本足夠小時(shí)才能拒絕原假設(shè),所以其拒絕域在左側(cè),是左側(cè)檢驗(yàn)。如果取

0.05

,查表得Z

Z

0.05

1.64

,故左側(cè)檢驗(yàn)的臨界值為-1.64,拒絕域?yàn)椋?∞,-1.64),如圖

10-3b)所示。同理,右側(cè)檢驗(yàn)的拒絕域?yàn)椋?.64,+∞),如圖

10-3c)所示。a)雙側(cè)檢驗(yàn)b)左側(cè)檢驗(yàn)c)右側(cè)檢驗(yàn)4.決策規(guī)則

由上面的分析可以看出,我們是依據(jù)樣本統(tǒng)計(jì)量與假定為真的參數(shù)取值(原假設(shè))之間的差異來判斷是否能拒絕原假設(shè)的。這種差異的本質(zhì)是一種誤差,形成這種誤差的原因有兩個(gè):一是隨機(jī)原因,這是由樣本的隨機(jī)性形成的,稱之為隨機(jī)性誤差;二是系統(tǒng)原因,這是由我們假定參數(shù)的取值為真(原假設(shè)為真)形成的,稱之為系統(tǒng)性誤差,其含義是參數(shù)真實(shí)的取值不是我們假定的哪個(gè)值。

直觀的理解,如果樣本統(tǒng)計(jì)量的值偏離假定為真的參數(shù)取值越“遠(yuǎn)”,則這種誤差是系統(tǒng)性誤差的可能性越大,我們拒絕原假設(shè)的理由就越充分;反之,則不能拒絕原假設(shè)。

判斷樣本統(tǒng)計(jì)量的值離假定為真的參數(shù)的取值“遠(yuǎn)”需要用檢驗(yàn)統(tǒng)計(jì)量,由于條件不同,檢驗(yàn)統(tǒng)計(jì)量的分布也不同,在上段中我們確定的檢驗(yàn)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布,即

z

檢驗(yàn)統(tǒng)計(jì)量。由樣本為統(tǒng)計(jì)量的值可計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的值,如果檢驗(yàn)統(tǒng)計(jì)量的值離

0過“遠(yuǎn)”,我們就可以認(rèn)為樣本統(tǒng)計(jì)量與假定為真的參數(shù)取值之間的誤差是系統(tǒng)性誤差,從而有足夠的理由拒絕原假設(shè)。以什么標(biāo)準(zhǔn)判斷“遠(yuǎn)”呢?這個(gè)標(biāo)準(zhǔn)就是拒絕域的臨界值。如果檢驗(yàn)統(tǒng)計(jì)量的值超過了臨界值,則說明已經(jīng)顯著的“遠(yuǎn)”了,或者說這種“遠(yuǎn)”是非偶然的(不是偶然原因形成的,或者說是顯著的),這時(shí)就有理由能拒絕原假設(shè)了。

這樣,我們可以歸納出假設(shè)檢驗(yàn)的決策規(guī)則,見表

10-2。表

10-2 z

檢驗(yàn)決策規(guī)則注:

為顯著性水平檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量與臨界值的比較決策結(jié)果雙側(cè)檢驗(yàn)拒絕原假設(shè)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)拒絕原假設(shè)右側(cè)檢驗(yàn)拒絕原假設(shè)

特別需要注意的是,如果不能做出拒絕原假設(shè)的決策時(shí),我們應(yīng)該表達(dá)為“不拒絕原假設(shè)”,而不應(yīng)該表達(dá)為“接受原假設(shè)”。這兩種表達(dá)形式是有本質(zhì)區(qū)別的,不拒絕原假設(shè)的含義是說還沒有足夠的證據(jù)證明原假設(shè)為假(并沒有認(rèn)定原假設(shè)一定為真),而接受原假設(shè)的含義是原假設(shè)為真。5.第Ⅰ類錯(cuò)誤與第Ⅱ類錯(cuò)誤

在假設(shè)檢驗(yàn)中,我們是依據(jù)樣本信息做出的決策。由于樣本具有偶然性,所以決策結(jié)果并不能保證

100%正確,或者說是可能犯錯(cuò)誤的。假設(shè)檢驗(yàn)中可能犯的錯(cuò)誤分為兩類:第Ⅰ類錯(cuò)誤與第Ⅱ類錯(cuò)誤。第Ⅰ類錯(cuò)誤也稱之為“拒真錯(cuò)誤”,是指原假設(shè)實(shí)際上為真,但卻被錯(cuò)誤的拒絕了;第Ⅱ類錯(cuò)誤也稱之為“存?zhèn)五e(cuò)誤”,是指原假設(shè)實(shí)際為假,但卻沒有拒絕它。假設(shè)檢驗(yàn)中可能出現(xiàn)四種不同的結(jié)果,歸納起來如表

10-3

所示。表

10-3

假設(shè)檢驗(yàn)中的四種結(jié)果不拒絕原假設(shè)拒絕原假設(shè)原假設(shè)實(shí)際為真結(jié)論正確結(jié)論錯(cuò)誤Ⅰ(拒真)原假設(shè)實(shí)際為假結(jié)論錯(cuò)誤Ⅱ(存?zhèn)危┙Y(jié)論正確

人們經(jīng)過比較認(rèn)為犯第Ⅰ類錯(cuò)誤的后果要比犯第Ⅱ類錯(cuò)誤的后果嚴(yán)重。第Ⅰ類錯(cuò)誤的后果好比一個(gè)人是清白的(原假設(shè)為真),但卻被判其有罪(拒絕原假設(shè));第Ⅱ類錯(cuò)誤的后果好比一個(gè)人有罪(原假設(shè)為假),但卻被判無罪釋放(不拒絕原假設(shè))。冤枉一個(gè)好人的后果顯然要比放過一個(gè)壞人的后果要嚴(yán)重的多,因?yàn)橐坏┯凶C據(jù)還是可以將壞人繩之以法的,所以人們總想辦法來控制犯第Ⅰ類錯(cuò)誤的可能性。

犯第Ⅰ類錯(cuò)誤是這樣的情形發(fā)生了:雖然原假設(shè)為真,但檢驗(yàn)統(tǒng)計(jì)量的值卻落入到拒絕域,從而做出了拒絕原假設(shè)的決策。因?yàn)榫芙^域?qū)?yīng)的概率為

,所以犯第Ⅰ類錯(cuò)誤的可能性就是顯著性水平

,所以一般做假設(shè)檢驗(yàn)時(shí),人們都會(huì)將

假定的比較?。ㄐ「怕剩?,目的之一就是要控制犯第Ⅰ類錯(cuò)誤的可能性。我們將犯第Ⅱ類錯(cuò)誤的可能性記為

,控制和計(jì)算

比較復(fù)雜。

于是,很多人就會(huì)有這樣一個(gè)想法,能不能同時(shí)使

都???這個(gè)愿望是無法實(shí)現(xiàn)的,這是因?yàn)檫@兩種可能性是一個(gè)此消彼長的關(guān)系,我們以單側(cè)檢驗(yàn)繪制一張示意圖來說明兩者之間的關(guān)系,如圖

10-4。

假設(shè)問題是一個(gè)右側(cè)檢驗(yàn):

H

0

:

0,

H1

:

0。如果檢驗(yàn)統(tǒng)計(jì)量的值沒有落入拒絕域(

的面積,圖

10-4

的上側(cè)),且原假設(shè)不正確,那么第Ⅱ類錯(cuò)誤就發(fā)生了。由于原假設(shè)不正確,故真實(shí)的

0要比原來假設(shè)的

0大,如圖

10-4

的下側(cè),顯然第Ⅱ類錯(cuò)誤發(fā)生的概率是除去

的部分,如果減少

的面積,則會(huì)增加

的面積。圖

10-4

的關(guān)系所以我們一般是事先設(shè)定一個(gè)較小的

。10.2一個(gè)總體的參數(shù)檢驗(yàn)

本節(jié)將具體討論對三種總體參數(shù)的檢驗(yàn),分別是總體均值

、總體比率

和總體方差

2

。上一節(jié)中的各種概念和方法都會(huì)在本節(jié)內(nèi)容中出現(xiàn),但由于檢驗(yàn)的參數(shù)不同,構(gòu)造檢驗(yàn)統(tǒng)計(jì)量的方法也不同。10.2.1

總體均值的假設(shè)檢驗(yàn)1.大樣本、總體方差已知在這個(gè)條件下,由中心極限定理可知,樣本均值服從正態(tài)分布,故我們可以構(gòu)造z

檢驗(yàn)統(tǒng)計(jì)量。(10-4)式中

——樣本均值;μ—-假設(shè)的總體均值

——總體標(biāo)準(zhǔn)差;n—-樣本容量【例

10-4】某果汁飲料包裝容量為

500ml/盒,為了判斷罐裝生產(chǎn)線生產(chǎn)是否正常,質(zhì)檢人員需要定期抽樣檢測容量。假如某天質(zhì)檢人員抽取

64

盒果汁飲料時(shí)行檢測,得到平均容量為

505ml/盒,總體標(biāo)準(zhǔn)差

15

,這時(shí)罐裝生產(chǎn)線工作是否正常?(取

0.05

)解:已知:n=64,

15

,

0.05建立假設(shè)由于研究者是質(zhì)檢人員,他支持的觀點(diǎn)是生產(chǎn)線工作不正常,所以這個(gè)問題的假設(shè)是:H

0

:

500

,

H1

:

500選擇合適的檢驗(yàn)統(tǒng)計(jì)量由于是大樣本,總體方差已知,那么使用z

檢驗(yàn)。

3)在本例中

0.05

,查表得

,故拒絕域?yàn)椋?∞,-1.96),(1.96,+∞)。4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值

由于

,故拒絕原假設(shè)。說明有足夠的證據(jù)證明這時(shí)生產(chǎn)線的生產(chǎn)是不正常的,罐裝量比標(biāo)準(zhǔn)值偏高(檢驗(yàn)統(tǒng)計(jì)量的值為正)。本例題結(jié)果的示意圖如下:圖

10-5

Z

分布及臨界值Z

分布【例

10-5】在例

10-4

中,如果將研究者換成工商管理人員,抽查了

64

盒這種果汁飲料進(jìn)行檢測,得到平均容量為

498

ml/盒,總體標(biāo)準(zhǔn)差

15

,在

0.05

水平下,工商管理人員將做出怎樣的判斷?解:已知:n=64,

,

15

,

0.05因?yàn)楣ど坦芾砣藛T支持的觀點(diǎn)是生產(chǎn)廠商可能有少罐裝的嫌疑,故這時(shí)的假設(shè)形式為:H

0

:

500

,

H1

:

500

這是一個(gè)單側(cè)檢驗(yàn)中的左側(cè)檢驗(yàn),拒絕域在左側(cè)。

0.05

時(shí)有,故拒絕域?yàn)椋?∞,-1.64)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:

由于

z

1.067

Z

0.05

1.64

,z=-1.067

沒有落入拒絕域,故不拒絕原假設(shè),沒有足夠的理由證明生產(chǎn)廠商有少罐裝的行為。左側(cè)檢驗(yàn)的結(jié)果示意圖如下:圖

10-6

左側(cè)檢驗(yàn)

在上面的檢驗(yàn)中是采用比較檢驗(yàn)統(tǒng)計(jì)量的值與臨界值的方法,這種方法稱為臨界值法,是假設(shè)時(shí)經(jīng)常用到的方法。除此以外,還可以用

p

值方法進(jìn)行假設(shè)檢驗(yàn)。

在之前的方法中,顯著性水平是在檢驗(yàn)之前就確定的,這就意味著事先確定了拒絕域,使我們有一個(gè)明確的取舍標(biāo)準(zhǔn)。但此方法不足的是,顯著性水平是犯第Ⅰ類錯(cuò)誤的上限,它只能提供檢驗(yàn)結(jié)果可靠性是否及格,對一個(gè)具體的檢驗(yàn)問題,不能給出其可能性的精確度量。

p

值是利用檢驗(yàn)統(tǒng)計(jì)量的值計(jì)算出的一個(gè)概率值,雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)的

p

值有所區(qū)別,通俗的講,p

值是檢驗(yàn)統(tǒng)計(jì)量的值與拒絕域方向相同的外側(cè)面積,我們以

z

檢驗(yàn)為例繪制

p

值的示意圖,如圖

10-7

所示。a)雙側(cè)檢驗(yàn)b)左側(cè)檢驗(yàn)c)右側(cè)檢驗(yàn)圖

10-7

假設(shè)檢驗(yàn)的

p

雙側(cè)檢驗(yàn)的

p

值在兩側(cè),而單側(cè)檢驗(yàn)中的左側(cè)檢驗(yàn)

p

值在左側(cè),右側(cè)檢驗(yàn)

p

值在右側(cè)。

由圖

10-7

可以看出,

p

值越小則說明樣本統(tǒng)計(jì)量與總體參數(shù)越不一致,越不利于原假設(shè)。如果計(jì)算得到

p

,則說明

p

值的臨界值(檢驗(yàn)統(tǒng)計(jì)量的值)落入拒絕域,故拒絕原假設(shè),否則不拒絕。

Z

分布的

p

值可以用Excel

計(jì)算得到。首先計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,再利用NORM.S.DIST

函數(shù)計(jì)算出標(biāo)準(zhǔn)正態(tài)分布對應(yīng)的下側(cè)面積,從而可以計(jì)算出

p

值。在例

10-4

中,z=2.67,可以得到其下側(cè)面積為

0.999841,則其上側(cè)面積為

0.000159,故對應(yīng)的

p=0.000159×2=0.000318,如圖10-7a)。此時(shí)有

p=0.000318<

0.05

,故拒絕原假設(shè)。

在例

10-5

中,由于

z=-1.067,這時(shí)要計(jì)算

z=1.067

上側(cè)的面積(因?yàn)?/p>

z=1.067

上側(cè)面積與

z=-1.067

下側(cè)面積相等,而

NORM.S.DIST

函數(shù)只能計(jì)算正值的上側(cè)面積)。計(jì)算得到

p=0.142986,如圖

10-7b)。此時(shí)有

p=0.142986>

0.05

,故不拒絕原假設(shè)。表

10-4大樣本、總體方差已知條件下一個(gè)總體均值的檢驗(yàn)方法雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)檢驗(yàn)統(tǒng)計(jì)量拒絕域p值決策規(guī)則如果則拒絕H02.小樣本、總體方差已知

由于小樣本有更大的偶然性,需要承擔(dān)更大的風(fēng)險(xiǎn),所以在這個(gè)條件下需要增加一個(gè)條件:總體服從正態(tài)分布,這樣,檢驗(yàn)的方法與大樣本時(shí)完全相同?!纠?/p>

10-6】某品牌汽車的生產(chǎn)商聲稱其生產(chǎn)的一款

2.0L

排量的自動(dòng)檔轎車的油耗不超過

8L/100km。為了證實(shí)這個(gè)說法,一家汽車俱樂部對該款車進(jìn)行了調(diào)查,由抽取的

16

輛車計(jì)算得到的平均油耗是8.9

L/100km,假設(shè)總體服從正態(tài)分布,總體標(biāo)準(zhǔn)差

1.5

L/100km,顯著性水平

0.05

,這些數(shù)據(jù)能支持汽車生產(chǎn)商的說法嗎?解:已知:n=16,

,

1.5

0.05由于研究者是汽車俱樂部,故他們支持的觀點(diǎn)是這款轎車的油耗要大于

8L/100km,故:H

0

:

8

,

H1

:

8由于總體服從正態(tài)分布,在小樣本、總體方差已知的條件下,仍然使用

z

檢驗(yàn)。查表得:

Z

Z

0.05

1.64

,拒絕域?yàn)椋?.64,+∞)。計(jì)算檢驗(yàn)統(tǒng)計(jì)的值得:

由于z

2.4

Z

0.05

1.64

,檢驗(yàn)統(tǒng)計(jì)量的值落入到拒絕域,故拒絕原假設(shè),汽車生產(chǎn)商說法不能成立。

如果使用

p

值方法,則要計(jì)算

z=2.4

對應(yīng)的

p

值。由

Excel

計(jì)算得

p=0.008198,則有

p=0.008198<

0.05

,故同樣拒絕原假設(shè)。檢驗(yàn)結(jié)果如圖

10-8

所示。圖

10-8

汽車油耗的假設(shè)檢驗(yàn)3.大樣本、總體方差未知

總體方差是參數(shù),在實(shí)際問題中一般是未知的。在這樣的條件下,我們需要用樣本標(biāo)準(zhǔn)差

s

來代替總體標(biāo)準(zhǔn)差

。這時(shí),經(jīng)過標(biāo)準(zhǔn)化變換的檢驗(yàn)統(tǒng)計(jì)量不再服從標(biāo)準(zhǔn)正態(tài)分布了,而是服從自由度為(n-1)的

t

分布。故此時(shí)的檢驗(yàn)統(tǒng)計(jì)量稱為t

檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)也稱為

t

檢驗(yàn)。(10-5)式中

—樣本均值s—樣本標(biāo)準(zhǔn)差n—樣本容量【例

10-7】國家電器產(chǎn)品安全質(zhì)量監(jiān)督檢驗(yàn)中心,是經(jīng)中國合格評定國家認(rèn)可委員會(huì)(CNAS)認(rèn)可的國家級實(shí)驗(yàn)室、國際電工委員會(huì)電工產(chǎn)品及元件合格評定組織(IECEE)認(rèn)可的國際CB

實(shí)驗(yàn)室、中國國家認(rèn)證認(rèn)可監(jiān)督管理委員會(huì)(CNCA)指定的國家強(qiáng)制性產(chǎn)品認(rèn)證(CCC)檢測實(shí)驗(yàn)室,是中國質(zhì)量認(rèn)證中心(CQC)、廣東質(zhì)檢中誠認(rèn)證有限公司(CTC)等認(rèn)證機(jī)構(gòu)簽約的CCC

認(rèn)證檢驗(yàn)和自愿認(rèn)證檢驗(yàn)實(shí)驗(yàn)室,工業(yè)產(chǎn)品生產(chǎn)許可證檢驗(yàn)實(shí)驗(yàn)室,也是中國能效標(biāo)識中心備案的能效標(biāo)識能源效率檢測實(shí)驗(yàn)室。

受某冰箱生產(chǎn)企業(yè)的委托,對其生產(chǎn)的型號為

BCD-216SDX

冰箱進(jìn)行檢測,其中一項(xiàng)是對冰箱的耗電量進(jìn)行檢測,這款冰箱標(biāo)注的耗電量是

24

小時(shí)

0.58

千瓦時(shí)。假設(shè)抽檢了

36

臺(tái)此款冰箱,得到

24小時(shí)耗電量的數(shù)據(jù)(數(shù)據(jù)見

Data10-1),如果取

0.05

這些數(shù)據(jù)能支持生產(chǎn)商的說法嗎?解:由樣本數(shù)據(jù)計(jì)算得:

X

0.63

,

s

0.16

,且n=36,

0.05

。

作為第三方檢測機(jī)構(gòu),其應(yīng)該站在保護(hù)消費(fèi)者的立場上,故假設(shè)為:

H

0

:

0.58

,

H1

:

0.58

由于是大樣本,總體方差未知,故檢驗(yàn)統(tǒng)計(jì)量服從自由度為

35的

t

分布。查表得:

t

(n

1)

t0.05

(35)

1.69

,故拒絕域?yàn)椋?.69,+∞)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值得:由于t

1.875

t0.05

1.69

,故拒絕域原假設(shè),這些數(shù)據(jù)不支持生產(chǎn)商的說法,說明平均而言這款冰箱的

24

小時(shí)耗電量超過其標(biāo)注的0.58

千瓦時(shí)。如果用

p

值方法,過程如下:在Excel

中運(yùn)用TDIST

函數(shù)可得t=1.875

上側(cè)的面積

p=0.034578,由于

p=0.034578<

0.05

,故拒絕原假設(shè)。檢驗(yàn)的結(jié)果如下圖所示。圖

10-9

冰箱

24

小時(shí)耗電量的假設(shè)檢驗(yàn)4.小樣本、總體方差未知

當(dāng)小樣時(shí),與

z

檢驗(yàn)一樣要求總體服從正態(tài)分布,仍然使用

t檢驗(yàn)?!纠?/p>

10-8】某品牌手工速凍餃子包裝袋上標(biāo)注的凈含量為

500

克。為了簡化包裝手續(xù),生產(chǎn)車間憑經(jīng)驗(yàn)認(rèn)為餃子速凍后的平均重量為20

克,所以決定每袋裝

25

個(gè)餃子。質(zhì)檢部門在生產(chǎn)線上隨機(jī)抽取了

25

個(gè)餃子,在速凍的狀態(tài)下稱得重量(數(shù)據(jù)見

Data10-2),假設(shè)總體服從正態(tài)分布,顯著性水平設(shè)為

0.05,質(zhì)檢部門能從這些數(shù)據(jù)和計(jì)算結(jié)果中可以得到怎樣的結(jié)論?解:由樣本數(shù)據(jù)計(jì)算得:

,s=1.8,且n=25,

0.05

研究者是質(zhì)檢部門,支持的觀點(diǎn)是餃子的平均重量不是

20

克,故假設(shè)為:

H

0

:

20

H1

:

20

由于總體服從正態(tài)分布,在小樣本、總體方差未知的條件下,仍然使用

t

檢驗(yàn)。查表得:

t

2

(n

1)

t0.025

(24)

2.06

,故拒絕域?yàn)椋?∞,-2.06),(2.06,+∞)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:

由于

,故拒絕原假設(shè),說明這時(shí)生產(chǎn)的速凍餃子的重要平均不足

20

克,如果每袋裝

25

個(gè)餃子,總重量會(huì)低于

500克(檢驗(yàn)統(tǒng)計(jì)量的值為負(fù))。

如果用

p

值方法,過程如下:

Excel

中運(yùn)用

TDIST

函數(shù)可得

t=2.5

雙側(cè)的面積

p=0.019654,由于

p=0.019654<

0.05

,故拒絕原假設(shè)。檢驗(yàn)的結(jié)果如下圖所示。圖

10-10

速凍餃子重量的假設(shè)檢驗(yàn)表

10-5

總體方差未知條件下一個(gè)總體均值的檢驗(yàn)方法

由上述過程我們可以歸納出假設(shè)檢驗(yàn)的一般方法和邏輯關(guān)系:首先假定原假設(shè)為真(反證法);在原假設(shè)為真的前提下,檢驗(yàn)統(tǒng)計(jì)量服從某種分布(中心極限定理);如果原假設(shè)為真,則由樣本計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量的值不會(huì)落入到小概率區(qū)域(拒絕域)。若檢驗(yàn)統(tǒng)計(jì)量的值落入到小概率區(qū)域,則有理由認(rèn)為原假設(shè)不為真(小概率原理)。10.2.2

一個(gè)總體比率的假設(shè)檢驗(yàn)

當(dāng)數(shù)據(jù)以定性的方式表示時(shí),就涉及到數(shù)據(jù)分析中的比率問題。例如市場研究人員想知道產(chǎn)品消費(fèi)者中女性的比率是否上升,制造車間的質(zhì)量控制人員想確定次品率是否符合要求等等。通常用字母

表示總體比率,用p

表示樣本比率。

總體比率的假設(shè)檢驗(yàn)同樣有雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn),檢驗(yàn)的方法與總體均值的檢驗(yàn)方法相同,有臨界值法和p值方法,但檢驗(yàn)統(tǒng)計(jì)量的形式有所區(qū)別。

由中心極限定理可知,從兩項(xiàng)分布總體中進(jìn)行隨機(jī)抽樣,當(dāng)樣本容量很大時(shí),其樣本比率

p

近似服從正態(tài)分布,所以總體比率也能進(jìn)行和總體均值類似的假設(shè)檢驗(yàn),我們使用的是

z

檢驗(yàn),要注意使用這種方法的前提是大樣本,此時(shí)大樣本標(biāo)準(zhǔn)是以下兩個(gè)條件需同時(shí)成立:

n

5

n(1

)

5

,或者參考表

8-5

中的經(jīng)驗(yàn)值。一個(gè)總體比率的z

檢驗(yàn)統(tǒng)計(jì)量為(10-6)式中

p

——樣本比率;

n

——樣本容量?!纠?/p>

10-9】

某購物網(wǎng)站的管理層認(rèn)為在其網(wǎng)站上網(wǎng)購的客戶超過75%為女性。為了證實(shí)這個(gè)推測,網(wǎng)站的營銷部門做一次專門調(diào)查。營銷部門隨機(jī)抽取了

400

位客戶進(jìn)行調(diào)查,其中

280

位客戶是女性,設(shè)

0.05

,這些數(shù)據(jù)支持管理層的推測嗎?解:已知:n=400,

0.05

,由樣本數(shù)據(jù)可計(jì)算得:營銷部門支持的觀點(diǎn)是女性客戶不會(huì)超過75%,故:H

0

:

75%

,

H1

:

75%由于n=400,顯然是大樣本,檢驗(yàn)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布,故用

z

檢驗(yàn)。查表得:Z

Z

0.05

1.64

,由于是左側(cè)檢驗(yàn),所以拒絕域?yàn)椋?∞,-1.64)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值得:由于z=-2.31<

Z

0.05

1.64

,檢驗(yàn)統(tǒng)計(jì)量的值落入到拒絕域,故拒絕原假設(shè),在該網(wǎng)站網(wǎng)購的客戶中女性不超過

75%。

如果用

p

值方法,過程如下:

在Excel

中,運(yùn)用

NORM.S.DIST

函數(shù)計(jì)算

z=2.31

上側(cè)的面積,可得

p=0.0104444,因?yàn)?/p>

p=0.010444<

0.05

,故拒絕原假設(shè)。檢驗(yàn)的結(jié)果如下圖所示。圖

10-11

網(wǎng)購客戶為女性的比率假設(shè)檢驗(yàn)表

10-6

一個(gè)總體比率的檢驗(yàn)方法10.2.3

一個(gè)總體方差的假設(shè)檢驗(yàn)

研究人員經(jīng)常需要對總體的方差進(jìn)行假設(shè)檢驗(yàn),例如在零件制造中,質(zhì)量控制人員不僅需要了解其平均質(zhì)量是否達(dá)標(biāo),還要了解其質(zhì)量變動(dòng)情況。因?yàn)橐唤M數(shù)據(jù)的方差越大,那么其均值的代表性就越差,說明其質(zhì)量越不穩(wěn)定,所以對方差的檢驗(yàn)是相當(dāng)重要的。從前面的章節(jié)知識我們知道樣本方差可以用來估計(jì)總體方差,在總體服從正態(tài)分布的假定前提下,可以利用卡方分布來進(jìn)行假設(shè)檢驗(yàn)。

2

檢驗(yàn)統(tǒng)計(jì)量公式如下:(10-7)式中 s2

——樣本方差;

n

——樣本容量。

一個(gè)總體方差的假設(shè)檢驗(yàn)有雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn),同樣有臨界值法和

p值方法?!纠?/p>

10-10】一條藥品自動(dòng)生產(chǎn)線的質(zhì)量標(biāo)準(zhǔn)規(guī)定灌裝的劑量方差不超過

0.25。生產(chǎn)線經(jīng)過檢修后重新投入生產(chǎn),質(zhì)檢人員抽取了

25袋進(jìn)行檢測(數(shù)據(jù)見

Data10-3),假定總體服從正態(tài)分布,顯著性水平

0.05

,根據(jù)這些數(shù)據(jù)質(zhì)檢人員能做出怎樣的判斷?解:由樣本數(shù)據(jù)計(jì)算得:

s

2

0.136

,且n=25,

0.05

質(zhì)檢人員支持的觀點(diǎn)是經(jīng)常檢修后,生產(chǎn)線灌裝的劑量方差發(fā)生了改變,故:

H0:

0.25,H1:

0.25

由于樣本方差服從卡方分布,

自由度為

24

,

查表得:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:由于,檢驗(yàn)統(tǒng)計(jì)量的值沒有落入拒絕域,故不拒絕原假設(shè),說明沒有足夠的證據(jù)證明生產(chǎn)線灌裝的劑量方差發(fā)生了改變。

如果用

p

值方法,過程如下:

Excel

中,運(yùn)用

CHIDIST

函數(shù)計(jì)算得到

2

13.056

上側(cè)面積為0.965,下側(cè)面積為

0.035??ǚ诫p側(cè)檢驗(yàn)的

p

值等于較小的面積乘以

2,故

p=0.07>

0.05

,故不拒絕原假設(shè)。

質(zhì)檢人員支持的觀點(diǎn)也可以是生產(chǎn)線工作不正常,這時(shí)的假設(shè)為:

查表得:,故拒絕域?yàn)椋?6.415,+∞)。

由于,檢驗(yàn)統(tǒng)計(jì)量的值沒有落入拒絕域,故不拒絕原假設(shè),說明沒有足夠的證據(jù)證明生產(chǎn)線工作不正常。

如果用

p

值方法,過程如下:

Excel

中,運(yùn)用

CHIDIST

函數(shù)計(jì)算得到

2

13.056

上側(cè)面積為p=0.965。由于

p=0.965>

0.05

,故不拒絕原假設(shè)。檢驗(yàn)的結(jié)果如圖:a)雙側(cè)檢驗(yàn)b)單側(cè)檢驗(yàn)圖

10-12

藥品生產(chǎn)線方差的假設(shè)檢驗(yàn)表10-7一個(gè)總體方差的檢驗(yàn)方法10.3.兩個(gè)總體參數(shù)的檢驗(yàn)

在很多情況下,我們都需要在兩個(gè)總體之間進(jìn)行比較。例如兩個(gè)不同地區(qū)農(nóng)民平均純收入是不是有差異?男性與女性的消費(fèi)行為真的有差異嗎?兩只股票的風(fēng)險(xiǎn)有差異嗎?等等。這些問題的本質(zhì)就是比較兩個(gè)總體的均值、比率和方差。

在兩個(gè)總體之間進(jìn)行比較,需要在兩個(gè)總體中分別進(jìn)行抽樣,這兩個(gè)樣本可以是獨(dú)立樣本,也可以是匹配樣本,兩種樣本的判斷方法有所不同。我們先討論獨(dú)立樣本的情形。10.3.1

兩個(gè)總體均值之差的假設(shè)檢驗(yàn)1.大樣本、總體方差已知

如果兩個(gè)獨(dú)立樣本都是大樣本,并且兩個(gè)總體方差都已知,這是非常理想的一種情形。因?yàn)?,在這個(gè)條件下,由中心極限定理可知每個(gè)樣本均值分別服從正態(tài)分布,再由正態(tài)分布再生定理可知,兩個(gè)樣本均值之差也服從正態(tài)分布,故可用

z

檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量為:(10-8)式中

——樣本1的均值;——樣本2的均值;——樣本1的容量;——樣本2的容量;——總體1的均值;

——總體2的均值;——總體1的方差;——總體2的方差?!纠?/p>

10-11】據(jù)中新網(wǎng)消息,武漢軌道交通

2

號線南延線

19

日上午開通,并與軌道交通

2

號線、機(jī)場線貫通試運(yùn)營。至此,武漢地鐵運(yùn)營線路達(dá)

12

條,通車總里程

318

公里。2019

年武漢市政府工作報(bào)告提出,今年武漢市還將開通

8

號線三期、蔡甸線,開工建設(shè)新港線、12

號線三期、11

號線葛店段,同步推進(jìn)

10

條線路續(xù)建。根據(jù)規(guī)劃,到

2024

年武漢將形成總長

606公里的軌道網(wǎng)。(2019

02

19

日證券時(shí)報(bào)網(wǎng))隨著地鐵營運(yùn)里程的增加,武漢市交通的擁堵狀況得到大大緩解,上班族花在上班路上的時(shí)間有所減少。某報(bào)社記者為此專門做了調(diào)查,她查閱了兩年前的數(shù)據(jù),并與現(xiàn)在的數(shù)據(jù)進(jìn)行比較,假設(shè)

0.05

,通過這些數(shù)據(jù),記者能夠得到怎樣的結(jié)論?樣本

1:(兩年前)

,

n1

50

,

1

10樣本

2:(現(xiàn)在)

n2

54

,

2

9解:這是一個(gè)兩個(gè)總體均值比較的假設(shè)檢驗(yàn)。H

0

:

1

2

0

(兩年前后上班路上的時(shí)間沒有變化)H1

:

1

2

0

(兩年前后上班路上的時(shí)間有變化)由于兩個(gè)樣本都是大樣本,總體方差已知,故用z

檢驗(yàn)。查表得:

Z

/2

Z

0.025

1.96

,故拒絕域?yàn)椋?∞,-1.96),(1.96,+∞)。

計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:

由于

,說明檢驗(yàn)統(tǒng)計(jì)量的值落入到拒絕域,故拒絕原假設(shè)。這個(gè)結(jié)果說明兩年前后武漢的上班族花在上班路上的時(shí)間有顯著的變化,具體來說是兩年后花在路上的時(shí)間減少了(檢驗(yàn)統(tǒng)計(jì)的量為正)。

如果用

p

值方法,過程如下:

在Excel

中,運(yùn)用

NORM.S.DIST

函數(shù)計(jì)算

z=2.67

外側(cè)的面積,可得

p=0.007585,因?yàn)?/p>

p=0.007585<

0.05

,故拒絕原假設(shè)。檢驗(yàn)的結(jié)果如下圖所示:圖

10-13

假設(shè)檢驗(yàn)結(jié)果

這個(gè)問題也可以設(shè)置為其他形式的假設(shè)檢驗(yàn)。

單側(cè)檢驗(yàn)(右側(cè)檢驗(yàn)):

H

0

:

1

2

0

(兩年前后上班路上的時(shí)間沒有減少)

H1

:

1

2

0

(兩年前后上班路上的時(shí)間減少了)

由于右側(cè)檢驗(yàn)的拒絕域?yàn)椋?.64,+∞),而檢驗(yàn)統(tǒng)計(jì)量的值為z=2.67,落入到拒絕域,故拒絕原假設(shè),說明兩年前后上班路上的時(shí)間減少了。2.小樣本、總體方差已知

由于小樣本有更大的偶然性,需要承擔(dān)更大的風(fēng)險(xiǎn),所以在這個(gè)條件下需要增加一個(gè)條件:總體服從正態(tài)分布,這樣,檢驗(yàn)的方法與大樣本時(shí)完全相同?!纠?/p>

10-12】一家大型連鎖超市在中心城區(qū)和郊區(qū)都有門店,經(jīng)營者認(rèn)為在不同的地區(qū)消費(fèi)者的年齡有明顯的差異,應(yīng)該采取不同的營銷策略。為了證實(shí)這個(gè)判斷,經(jīng)營者在中心城區(qū)和郊區(qū)門店的消費(fèi)者中分別抽取了兩個(gè)樣本進(jìn)行比較,如果總體都服從正態(tài)分布,

0.05

,下列數(shù)據(jù)能支持經(jīng)營者的判斷嗎?樣本

1:(中心城區(qū))

,

n1

25

1

10樣本

2:(郊區(qū))

,

n2

18

,

2

9解:這是一個(gè)小樣本、總體方差已知的情況,因?yàn)榭傮w服從正態(tài)分布,故仍然用z

檢驗(yàn)。

經(jīng)營者支持的觀點(diǎn)是不同地區(qū)的消費(fèi)者年齡不同,故假設(shè)為:

H

0

:

1

2

0

,

H1

:

1

2

0

查表得:

Z

/2

Z

0.025

1.96

,故拒絕域?yàn)椋?∞,-1.96),(1.96,+∞)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值:由于

,說明檢驗(yàn)統(tǒng)計(jì)量的值沒有落入到拒絕域,故不拒絕原假設(shè)。說明中心城區(qū)和郊區(qū)消費(fèi)者的年齡沒有顯著的差異。

如果用

p

值方法,過程如下:

Excel

中,運(yùn)用

NORM.S.DIST

函數(shù)計(jì)算z=1.715

外側(cè)的面積,可得

p=0.086345,因?yàn)?/p>

p=0.086345>

0.05

,故不拒絕原假設(shè)。

這個(gè)問題的另外一種形式可能更加合理,就是單側(cè)檢驗(yàn)。如果經(jīng)營者支持的觀點(diǎn)是中心城區(qū)消費(fèi)者的年齡比郊區(qū)的大,則假設(shè)為:

H

0

:

1

2

0

,

H1

:

1

2

0

則拒絕域?yàn)椋?.64,+∞)。檢驗(yàn)統(tǒng)計(jì)量的值仍然為

z=1.715,落入到拒絕域,故拒絕原假設(shè),說明中心城區(qū)消費(fèi)者的年齡要比郊區(qū)消費(fèi)者的年齡顯著的大。為什么數(shù)據(jù)相同,而假設(shè)不同,我們會(huì)得到了不同的結(jié)論呢?這是因?yàn)檠芯空邔︼L(fēng)險(xiǎn)方向判斷不同的結(jié)果,在右側(cè)檢驗(yàn)中,研究者將

(風(fēng)險(xiǎn)水平)都分配在右側(cè)(研究者認(rèn)為左側(cè)風(fēng)險(xiǎn)不會(huì)發(fā)生),這時(shí)拒絕域都在右側(cè),這時(shí)拒絕域的臨界值將變小,從而得到了不同的決策結(jié)果。3.大樣本、總體方差未知

在大部分情況下,總體方差是無法事先得到的,這時(shí)我們需要使用樣本方差來代替總體方差,在大樣本條件下,經(jīng)過標(biāo)準(zhǔn)化變換后,檢驗(yàn)統(tǒng)計(jì)量服從t

分布,故稱之為t

檢驗(yàn)。

但是,t

檢驗(yàn)的自由度的確定要分兩種情況。

1)

兩個(gè)總體方差相等在這個(gè)條件下,兩個(gè)總體數(shù)據(jù)分散程度是一樣的,故在兩個(gè)總體取樣的風(fēng)險(xiǎn)相對較小,這時(shí)檢驗(yàn)統(tǒng)計(jì)量為:式中——樣本1的均值;——總體1的均值——樣本2的均值;——總體2的均值——樣本1的容量;——樣本1的方差——樣本2的容量;——樣本2的方差

(10-9)其中稱為聯(lián)合方差估計(jì)。2)

兩個(gè)總體方差不相等

在這個(gè)條件下,兩個(gè)總體數(shù)據(jù)分散程度是不一樣的,故在兩個(gè)總體取樣的風(fēng)險(xiǎn)相對較大小,這時(shí)檢驗(yàn)統(tǒng)計(jì)量為:(10-10)

其中自由度為

[x]表示不超過

x

的最大整數(shù)。

可以證明:

也就是說,

我們可以用較小的自由度來對沖風(fēng)險(xiǎn)?!纠?/p>

10-13】

2017

年“學(xué)生體質(zhì)健康評價(jià)與運(yùn)動(dòng)干預(yù)”高峰論壇,今天在上海華東師范大學(xué)閉幕,論壇上,由華東師范大學(xué)“青少年健康評價(jià)與運(yùn)動(dòng)干預(yù)”教育部重點(diǎn)實(shí)驗(yàn)室與日本相關(guān)機(jī)構(gòu)合作研究發(fā)布的《中日兒童青少年體質(zhì)健康比較研究結(jié)果公報(bào)》受到關(guān)注。該項(xiàng)成果歷時(shí)3

年,分別在中國與日本的

4

個(gè)城市或地區(qū),對近兩萬名

7~18

歲的兒童青少年,運(yùn)用同樣的方法和標(biāo)準(zhǔn)進(jìn)行測試后完成。結(jié)果顯示,“2014

年和

2016

年,中國兒童青少年體格指標(biāo)(身高、體重和

BMI)大部分年齡段顯著高于日本;但體能指標(biāo)的比較中,日本兒童青少年在心肺耐力、柔韌性和靈敏協(xié)調(diào)性方面均顯著高于中國。”

(2018-10-28

搜狐健康)

假設(shè)該項(xiàng)目研究人員在中日兩國某一年齡組分別抽取了部分男生測試

50

米跑,測試數(shù)據(jù)如下。假定兩個(gè)總體的方差相等,

0.05

,在

50

米跑項(xiàng)目上中日兩國這個(gè)年齡組的男生存在顯著差異嗎?樣本

1:(中國)

(秒),n1

135

,

s1

1.1樣本

2:(日本)

(秒),n2

117

,s2

1.0解:由于研究者支持在這個(gè)項(xiàng)目上中國兒童的整體水平低于日本兒童的整體水平,故:H0:

1

2

0,H1:

1

2

0

這是一個(gè)大樣本、總體方差未知但相等的問題,故用

t

檢驗(yàn),自由度為

250。

在Excel

中使用

T.INV.2T

函數(shù)(注意是雙側(cè),故Probability

選項(xiàng)中要輸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論