第8章 假設(shè)檢驗_第1頁
第8章 假設(shè)檢驗_第2頁
第8章 假設(shè)檢驗_第3頁
第8章 假設(shè)檢驗_第4頁
第8章 假設(shè)檢驗_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第8章假設(shè)檢驗

(HypothesisTesting)

假設(shè)檢驗是抽樣統(tǒng)計推斷的另一項

重要內(nèi)容。它是利用樣本的實際觀測資

料來檢驗事先對總體某些數(shù)量特征所

作的假設(shè)是否可信的統(tǒng)計分析方法。根

據(jù)已有的知識(情報)對總體的數(shù)量特

征和變動規(guī)律做出一定的假設(shè),然后運

用觀測到的樣本的資料和一定程序,來

判斷事先所作的假設(shè)是不是合理可信,

從而決定接受或拒絕這個假設(shè)。

8.1假設(shè)檢驗的概念

小概率的原理

假設(shè)檢驗的基本思想是應(yīng)用小概

率的原理。所謂小概率原理是指發(fā)生概

率很小的隨機事件在一次試驗中幾乎

是不可能發(fā)生的。根據(jù)這一原理我們可

以做出是否接受原假設(shè)的決定,即進行

假設(shè)檢驗時必須事先確定一個作為接

受或拒絕的判斷界限的小概率標準。該

小概率標準就是統(tǒng)計假設(shè)檢驗中的顯

著性水平。在假設(shè)檢驗過程中,我們可

以依據(jù)顯著性水平的大小把概率分布

劃分為接受區(qū)間和拒絕區(qū)間。大于給定

標準的概率區(qū)間稱為接受區(qū)間,小于給

定的概率區(qū)間稱為拒絕區(qū)間。

假如給定的小概率標準為。=0.1,

凡概率小于10%的事件都稱為小概率事

件,均屬于拒絕區(qū)間。而概率大于等于

二90%的事件都稱為對立事件概率,

均屬

于接

受區(qū)

間。事

件屬

于接受區(qū)間,意味著原假設(shè)成立而無顯

著性差異;事件屬于拒絕區(qū)間,意味著

原假設(shè)不成立,而認為有顯著性差異。

顯著性水平a所對應(yīng)的概率度t稱為a

的臨界值,記為L例如。=0.1時,

廿1.64。我們稱概率小于0.1的事件

為小概率事件。但實際假設(shè)檢驗分析中

作為接受或拒絕的判斷尺度臨界值,比

顯著性水平戊更為常用。

根據(jù)我們所研究的對象的性質(zhì)和

特征的不同,統(tǒng)計假設(shè)檢驗又可分為雙

側(cè)檢驗和單側(cè)檢驗兩種類型。當我們的

研究只對檢驗樣本和總體的平均數(shù),或

樣本和總體的平均數(shù)有沒有顯著性差

異關(guān)心,而不問差異的方向(正差或負

差)時采用雙側(cè)檢驗方法。但我們所要

檢驗的是抽取樣本的總體的參數(shù)值偏

大于還是偏小于某個特定值時采用單

側(cè)檢驗方法。因此,單側(cè)檢驗方法有右

單側(cè)檢驗和左單側(cè)檢驗兩種。當我們所

要檢驗的是總體的參數(shù)值是否大于某

個特定值,應(yīng)采用右單側(cè)檢驗;反之,

應(yīng)采用左單側(cè)檢驗。在雙側(cè)檢驗中原假

設(shè)與替換假設(shè)通常采用等式,在單側(cè)檢

驗中原假設(shè)與替換假設(shè)取不等式。

雙側(cè)檢驗:乩:4="。HH、

右單側(cè)檢驗:乩?A—Z^oH、:網(wǎng)

左單側(cè)檢驗:乩:心"。/:〃<〃。

〃為計算值為為假設(shè)值

總而言之,假設(shè)檢驗是對我們所關(guān)

心的,卻又是未知的總體參數(shù)先做出假

設(shè),然后抽取樣本,利用樣本提供的信

息對假設(shè)的正確性進行判斷的過程。它

是進行各種經(jīng)濟行為、管理及決策的有

力工具。

8.2一個正態(tài)總體參數(shù)的假設(shè)檢驗

根據(jù)已知條件,一個正態(tài)總體參數(shù)

的檢驗方法通常可以分為兩種。一種方

法是當總體的方差/為已知數(shù)時,以Z

為檢驗統(tǒng)計量進行檢驗;另一種方法是

當總體的方差〃為未知數(shù)時,以廣作為

檢驗統(tǒng)計量進行檢驗。

8.2.1總體平均數(shù)〃的假設(shè)檢驗

8.2.L1總體的方差〃為已知數(shù)時

設(shè)隨機變量匕”,…,是從符合正態(tài)

分布的總體中抽取的樣本,且總體和樣

本的平均數(shù)及方差分別為“、元、。2、一

①原假設(shè)與替換假設(shè);H°:…

H]:〃W〃o

②檢驗統(tǒng)計量(概率度)z;

(8-1)

③設(shè)定顯著性水平。

④計算檢驗統(tǒng)計量(概率度)z值:

⑤做出統(tǒng)計決策:

若|Z|〈|4,2|,則接受原假設(shè)義,拒

絕替換假設(shè)”I

若團>凡小則拒絕原假設(shè)“。,接

受替換假設(shè)/_

例8-1:設(shè)"=600,工=630,0=30,n=100,。=0.05。

試求雙側(cè)檢驗(替換假設(shè)乩:〃#600)和右側(cè)檢驗(替

換假設(shè)兄:4>600)時的臨界值。

解:LISASPROGRAM

DATAexamplel;

ALPHA=O.05;n=100;sigma=30;mu0=600;barX=630;

Zcal=(barX-muO)/(sigma/SQRT(n));zl=PR0BIT(ALPHA/2);

一雙側(cè)檢驗(計算臨界值)

IFABS(Zcal)>=ABS(zl)THENRESULT1=,REJECT5;ELSE

RESULTS'ACCEPT;

z2=PR0BIT(l-ALPHA);一右側(cè)檢

驗(計算臨界值)

IFZeal>=z2THENRESULT2='REJECT,;ELSE

RESULT2='ACCEPT;RUN;

PROCPRINT;VARALPHAZCALzlRESULT1z2RESULT2;RUN;

口運行結(jié)果

OBSALPHAZCALZlRESULT1

Z2RESULT2

10.0510-1.95996REJECT

1.64485REJECT

利用SASPROGRAM計算的結(jié)果得,雙側(cè)檢驗臨界值

Z°/2=±L96右側(cè)檢驗臨界值=1.645;因為

z>|za/2|,z>|zJ,所以雙側(cè)檢驗原假設(shè)%:〃=4

和右單側(cè)檢驗的原假設(shè):4。均被否定.

(圖8-2)“°的接受區(qū)和拒絕區(qū)

(a)雙側(cè)檢驗(b)右側(cè)檢驗

-1.961.961.64

又與〃的關(guān)系替換假設(shè)的形態(tài)檢驗方法

x>〃0"1:4〉右單側(cè)檢驗

x<Ao“1:〃<〃0左單側(cè)檢驗

8.2.1.2總體的方差一為未知數(shù)時

因為總體的方差/為未知數(shù),不能

直接利用Z-統(tǒng)計量。所以利用廠-檢驗

統(tǒng)計量(詳見8.6)o

(8-2)

當〃230時,玄令一?Z,即L分布

和Z-分布相接近,可設(shè)z=F,并把它

作為檢驗統(tǒng)計量計算臨界值,這樣可以

不用考慮自由度的問題。

例8-2:設(shè)某百貨商店的電冰箱銷售量服從正態(tài)分布。

已知gx,=10()(Xi代表第,天電冰箱銷售量);

r=1

10°

ZXj=23500o并設(shè)定"o:4212。試在。=0.05

t=\

的條件下檢驗。

□SASPROGRAM

DATAexample2;

ALPHA=O.05;MU0=12;N=10;SUMX=100;SUMX2=23500;

BarX=sumX/n;s2=(sumX2-n*barX**2)/(n-l);

Tcal=(barX-muO)/SQRT(s2/n);

>TINV(ALPHA,n-1);

IFTcal=TTHENRESULT='REJECT';ELSE

RESULT='ACCEPT';RUN;

PROCPRINT;VARALPHATealtRESULT;RUN;

□運行結(jié)果

OBSALPHATCALT

RESULT

10.05-0.12649

-1.83311ACCEPT

解:因為總體的方差〃為未知數(shù),以「統(tǒng)計量作為檢

驗統(tǒng)計量。又因為“。:4>=12,所以替換假設(shè)為

根據(jù)題意作左側(cè)檢驗。若廣〉一^則原假

設(shè)成立。利用SASPROGRAM計算的結(jié)果

T=-0.1265>-^=-1.833,所以,一天的電冰箱平均

銷售量超過12臺的原假設(shè)成立。

例8-3:若把例8-2的樣本容量由原來的10天增加到

100天(N=100),并設(shè)其他的條件不變。這時我們可以

利用Z-統(tǒng)計量。即

「一4)

7…(8-3)

計算結(jié)果Z=-0.4>Za=-1.64485,所以原假設(shè)成立。

例8-4:某生產(chǎn)燈泡企業(yè)的新職工,上班的第一個月生

產(chǎn)了100只燈泡,其中隨機抽出5只燈泡作了壽命試

驗,其壽命分別為70,75,80,85,90(天)。試檢驗

燈泡的平均壽命為75天的可能性(設(shè)。=0.1)。

解:設(shè)“0:設(shè)<75,"]:〃>75。即作右側(cè)檢驗,

若T*<%則原假設(shè)成立。因為N=100,所以利用有限總

體調(diào)整系數(shù)來計算。利用SASProgram計算的結(jié)果,

*

T=1.443680,=1.53321o所以燈泡的平均壽命不

能超過75天的原假設(shè)成立。

□SASPROGRAM

DATAEXAMPEL4;

INPUTX@@;

CARDS;

7075808590

RUN;

PROCMEANSNOPRINT;VARX;OUTPUTOUT=OUTPUTN=n

MEAN=BARXVAR=S2;RUN;

DATARESULT;SETOUTPUT;

ALPHA=O.1;MU0=75;CC=(100-n)/(100-1);

TCAL=(BARX-MUO)/SQRT((S2/N)*CC);T=TINV(1-ALPHA,N-1

);

IFTCAL=TTHENRESULT='REJECTJ;ELSE

RESULT='ACCEPTJ;RUN;

PROCPRINT;VARALPHATCALTRESULT;RUN;

□運行結(jié)果

OBSALPHATCALT

RESULT

10.11.443681.53321

ACCEPT

8.3兩個正態(tài)總體參數(shù)檢驗

8.3.1兩個正態(tài)均值之間的假設(shè)檢驗

8.3.1.1、犬為已知數(shù)時,兩個總

體平均值的假設(shè)檢驗

在經(jīng)濟分析中,常常需要比較兩個

總體的參數(shù)。比如,北方地區(qū)和南方地

區(qū)的經(jīng)濟發(fā)展水平是否有顯著性差異

等,對這種兩個總體(地區(qū))的參數(shù)是

否有顯著性差異的問題,可用兩個正態(tài)

總體參數(shù)檢驗的方法來解決,其檢驗步

驟如下:

第一步:設(shè)兩個總體的平均值和方

差分別為〃1、“2和4、成,原假設(shè)可設(shè)

定為兩個總體的平均值相等。即

H0:"\=〃2"I:41W

第二步:分別從兩個總體中抽出一

個樣本,得到樣本容量和平均數(shù)分別為

%、兄和叼,心的樣本。如果兄和院服

從正態(tài)分布,則兄士心也服從正態(tài)分

布。下面計算一下新的概率變量元-及

的平均值和方差。

E區(qū)-X2]=E區(qū)]-仇》21=從—4

???(8-8)__

V[Xl-X2]=V[Xi]+V[X2]-2Cov(Xi,X2)

—月和先是相互獨立的,所以其協(xié)方差2Cov(月,

x2)-0

22

V區(qū)-晨]=J+J

n{n2

???(8-9)

(X1-X2),

N[(?),(五+生)]-(8-10)

%〃2

把(月一月)進行標準化得到標準化的檢驗統(tǒng)計量;

Z=(XI-X2)-(41--2)

-

\%n2

???(8-11)

第三步:計算檢驗統(tǒng)計量。并根據(jù)原假設(shè)設(shè)定雙

側(cè)檢驗還是單側(cè)檢驗。若原假設(shè)為

則需要雙側(cè)檢驗土Zq/2;若“。:>°,則左側(cè)檢

驗-Z*;若H。:"「從<0,則右側(cè)檢驗Za/2o

第四步:根據(jù)所給定的顯著性水平a值和z的臨

界值,進行判斷。

例8-7:某汽車公司為了檢驗4型汽車和B型汽

車的耗油量,分別從A型和B型汽車中隨機抽出9輛

汽車作了試驗。試驗結(jié)果表明,當消耗1升汽油時,

兩種型號汽車的平均行駛距離分別為12Km.HKmo如

果A,8這兩種型號汽車的標準差分別服從i.5Km/升

和IKm/升的正態(tài)分布,試分析在顯著性水平為a=1%

的條件下,4—4二°的原假設(shè)是否成立。

解:根據(jù)題意,利用檢驗統(tǒng)計量(8-11)進行雙側(cè)檢

驗。

Z=(X1-X2)-(〃1-〃2)=12-11-0

Jcr:/"i+cr;//211.52

V-99~

與顯著性水平為。=1%相對應(yīng)的臨界值為

土Za〃=±2.575,因為-Z0/2=-2.575<Z<Za/2=2.575,

所以原假設(shè)成立,即48兩種型號汽車的汽油消耗量

沒有顯著性差異。

DATAexample7;

ALPHA=0.01;nl=9;n2=9;barXl=12;barX2=ll;sl=l.5;

s2=l;

Zcal=(barXl-barX2)/SQRT(sl**2/nl+s2**2/n2);

Z=PROBIT(ALPHA/2);

IFABS(Zcal)>=ABS(Z)THENRESUL='REJECT';ELSE

RESULT」ACCEPT;RUN;

PROCPRINT;VARALPHAZealzRESULT;RUN;

□運行結(jié)果

OBSALPHAZCALZRESULT

10.011.66410-2.57583ACCEPT

8.3.1.2M、4為未知數(shù)時,兩個總

體均值之差的假設(shè)檢驗

L樣本容量較大的情況

如果措、成為未知數(shù),但樣本為大

樣本時,我們可用樣本的方差$;、s;代

替總體的斕、武,利用下面的近似公式

計算檢驗統(tǒng)計量。

Z_(X]-X2)-(〃l-從2)_(x1-X2)-(4一〃2)

]2/72?+(T2/n2!n\+S;I口2

…(8-12)

在前面的例8-6中,假設(shè)b:、8是

未知數(shù)。如果把樣本容量由原來的9

個擴大到32個時,測得A3兩種型號汽

車的平均行駛距離分別為12Km/升、

n.5Km/升。這時我們可利用(8-12)

式來進行假設(shè)檢驗。

Z=(12TL5)=2

/1/32)2+(1/32f

顯著性水平為a=1%的條件下

±Za/2=±2.575,所以原假設(shè)成立。但如果

給定的顯著性水平為?=0.05%

(±Za/2=±1.96),則原假設(shè)不成立。

2.樣本容量較小的情況

如果統(tǒng)為未知數(shù),且樣本容量較

小時,可利用下面的檢驗統(tǒng)計量進行假

設(shè)檢驗(詳見8.6.3)。

t_(X]二〃2).、

n}+n2-2=『i-一L―???(8-13)

/(■T)s:+(%T)s;

s人=XL-%)

?十幾?

N—2nx+

但利用上面的檢驗統(tǒng)計量,必須滿

足這樣的兩個條件。首先兩個總體必須

滿足正態(tài)分布;其次是兩個總體的方差

必須相等4=Cr2o

例8-8:在同屆畢業(yè)的文科和工科畢業(yè)生中各隨機抽出

10、15名,其調(diào)查結(jié)果表明,文科和工科類畢業(yè)生的

工資收入分別為80、75萬(韓幣),方差分別為300、

200o試問在顯著性水平a=0.05的條件下,同屆畢業(yè)

的文科和工科類畢業(yè)生的工資水平是否有顯著性差

異。

解:設(shè)同屆畢業(yè)的文科和工科類畢業(yè)生的工資水平?jīng)]

有顯著性差異???/p>

9)DATAexamples;

ALPHA=0.05;nl=10;n2=15;barX1=80;barX2=75;Sl=SQRT(300);S2=SQRT(200);

即Ho:〃]■/=0

-2_(%-l)s;+(〃2T)s;_(10-1)300+(15-1)200_55(

“1+〃2—210+15—22:

V^1=80,^2=75

在。=0.05的條件下,自由度為

%+々-2=10+15-2=23時,相應(yīng)的臨界值查表可得

—taR23=±2.069。因為—%2,23<,<%/2,23,所以同屆

畢業(yè)的文科和工科類畢業(yè)生的工資水平?jīng)]有顯著性差

異的原假設(shè)成立。

DATAexamples;

ALPHA=0.05;nl=10;n2=15;barXl=80;barX2=75;

Sl=SQRT(300);S2=SQRT(200);

Spooled=((nl-1)*sl**2+(n2-l)*s2**2)/(nl+n2-2);Tcal=

(barXl-barX2)/SQRT(Spooled*(l/nl+l/n2));

T=TINV(ALPHA/2,nl+n2-2);

Spooled=((nl-l)*sl**2+(n2-l)*s2**2)/(n1+n2-2);Tcal=(barX1-barX2)/SQRT(Spool.ed*(l/nl+l/n2));

T=TINV(ALPHA/2,nl+n2-2);

IFABS(Tcal)>=ABS(t)THENRESULT:'REJECT';ELSERESULT:'ACCEPT';RUN;

PROCPRINT;VARALPHATealtRESULT;RUN;

□運行結(jié)果

OBSALPHATCALTRESULT

10.050.79201-2.06866ACCEPT

IFABS(Tcal)>=ABS(t)THENRESULTiREJECT;ELSE

RESULTiACCEPT,;RUN;

PROCPRINT;VARALPHATealtRESULT;RUN;

口運行結(jié)果

OBSALPHATCALT

RESULT

10.050.79201-2.06866

ACCEPT

8.6假設(shè)一檢驗

8.6.1一個總體平均數(shù)的一檢驗

設(shè)隨機變量匕*2,…,X”是從符合

正態(tài)分布的總體中抽取的樣本,且總體

和樣本的平均數(shù)及方差分別為4、又、

,、當總體方差M為未知數(shù)時,不

能選擇Z統(tǒng)計量,此時需要用樣本方差

$2代替總體方差檢驗統(tǒng)計量服從自

由度為〃-1的乙分布。J檢驗步驟如下;

1)原假設(shè)與替換假設(shè):…="。

H、:N豐Ao

2)檢驗統(tǒng)計量(概率度)匕

T*_x-A。_J7(x_〃。)???1

T~s/^~s(8-1

7)

在大樣本(隨機變量的容量〃2

30)的情況下,,?分布和Z?分布相接近。

樣本統(tǒng)計量,服從或趨近于期望值為0、

(圖8-5)l檢驗的接受區(qū)和拒絕區(qū)差

1

態(tài)分布N(0,1)。根據(jù)實際抽樣調(diào)查資

料,計算樣本的平均數(shù)又及標準差S,

就可以具體確定統(tǒng)計量T*值。

設(shè)定顯著性水平a-計算檢驗統(tǒng)

計量l值(K)一作出統(tǒng)計決策。若原

假設(shè)成立,則檢驗統(tǒng)計量(概率度)服

從自由度為九-1的一分布。在顯著性水

準a條件下,對不同的替換假設(shè),有不

同的統(tǒng)計決策。

%:〃>〃。,如果T*>%皿,則原假設(shè)

”。被否定(右單側(cè)檢驗)2)o

Hl:…。,如果:a,n-l,則原假

設(shè)/被否定(左單側(cè)檢驗)。

況:"玲,如果7|>乙/”「)則原

假設(shè)"。被否定(雙側(cè)檢驗)。

3)P-值及統(tǒng)計決策

值是檢驗樣本和原假設(shè)之間一

致性程度的尺度。P-值可根據(jù)邏輯對立

假設(shè)計算。

15)t“.n“值等于自由度為n-1的t-分布的aX100%。

P=P(K.i>T*):右單側(cè)檢驗時,檢

驗統(tǒng)計量T*的尸-值是自由度為〃-1的

L分布中,比檢驗統(tǒng)計量/大的概率。

如果尸-值越小,則檢驗統(tǒng)計量越接近一

分布的右尾部,原假設(shè)/被否定的可能

性越大;反之P-值越大,則原假設(shè)“。被

接受的可能性越大。

尸二尸(,一KT*):左單側(cè)檢驗時,檢驗

統(tǒng)計量廠的夕-值是自由度為〃-1的,

分布中,比檢驗統(tǒng)計量廠小的概率。如

果「值越大,則檢驗統(tǒng)計量越接近分

布的左尾部,原假設(shè)“。被否定的可能性

越大,反之?-值越大,則原假設(shè)“。被

接受的可能性越大。

P=2P|):雙側(cè)檢驗時,檢

驗統(tǒng)計量I廣I的P-值是自由度為n-l

的L分布中,比檢驗統(tǒng)計量7*的絕對值

大的概率。如果P-值越大,則檢驗統(tǒng)

計量越接近,-分布的左尾部,原假設(shè)“。

被否定的可能性越大,反之P-值越大,

則原假設(shè)“。被接受的可能性越大。

(圖8-6)P-雙側(cè)檢驗接受區(qū)和拒絕區(qū)可

統(tǒng)

計量T*的夕-值和顯著性水平。的相互

比較的方法,作出統(tǒng)計決策。在SAS統(tǒng)

計分析程序中,SAS軟件自動把統(tǒng)計量

T值換算成相應(yīng)的尸-值工如果尸-值大

于顯著性水平%則原假設(shè)成立。如果

尸-值小于顯著性水平則原假設(shè)被否

定。即,若尸-值>1,則原假設(shè)"。成立;

若P-值則原假設(shè)“。被否定。P~

值可以提供更多的信息,不僅可以用尸-

值與規(guī)定的顯著性水平]比較,進行檢

驗統(tǒng)計決策,而且P-值顯示了樣本值在

一定范圍內(nèi)出現(xiàn)的概率。這有助于我們

對檢驗對象有更進一步的了解,同時也

為進行更多靈活的檢驗統(tǒng)計決策提供

可能。在SAS軟件中,就利用這一重要

的參數(shù)進行假設(shè)檢驗問題分析,并把它

作為統(tǒng)計決策的依據(jù)。

例8-11:某生產(chǎn)電子原件的企業(yè),生產(chǎn)一種A元件。

過去A元件的平均壽命為25個月。但該企業(yè)的技術(shù)管

16)在SAS程序,SAS軟件對檢驗統(tǒng)計量進行雙側(cè)檢驗,算出IT的概率(即prob|T|)。

所以單側(cè)檢驗時,必須除以2。

理科認為,通過引進外國先進設(shè)備及技術(shù)后,A元件的

平均壽命有明顯的提高。于是他們隨機抽出15個樣品

作了壽命試驗。其試驗結(jié)果如表8-2。(表8-2)A元件

壽命試驗資料

282527311026302555122432284238

設(shè)A元件壽命服從正態(tài)分布,其顯著性水平a=0.05。

試求:1)15個樣品的平均數(shù)和標準差2)假定原假設(shè)

和替換假設(shè)3)計算檢驗統(tǒng)計量的展值,并解釋其結(jié)

解:根據(jù)題意"。=25,假定原假設(shè)和替換假設(shè)。

H。:〃=〃。,即A元件的壽命沒有顯著提高;a:〃>"。

即A元件的壽命有顯著提高。

□SASPROGRAM

DATAexampl1;

INPUTX

DX=X-25;

*-(a)

CARDS;

282527311026301555122432284238

RUN;

PROCMEANSMEANSTDTPRTMAXDEC=2;TITLE,ONE-TAILED

TTEST,;VARDX;RUN;

一(b)

□PROGRAM解釋

(a)DX=X-25

用SAS程序分析樣品和總體平均數(shù)之間的顯著性差異時,

SAS程序自動的進行雙側(cè)檢驗分析,Ho:u=25,乩:口工25。

所以利用總體平均數(shù)和樣本的離差變量DX=X-25o

(b)PROCMEANSMEANSTDTPRTMAXDEC=2

PROCMEANSMEANSTDT是計算檢驗統(tǒng)計量的命令。PRT

MAXDEC=2表示雙側(cè)檢驗,PRT命令將打印檢驗統(tǒng)計量p-值。

□運行結(jié)果及解釋

ONE-TAILEDTTEST

AnalysisVariable:DX

StdDev

Prob>|T|

11.44

0.2970

P/2=0.1485

拒絕Ho0.05

05=0.95

u=0

8,檢驗統(tǒng)計量p-值=0.2970。因為在SAS程序自動進行雙側(cè)檢

驗,故p/2=0.1485X).05。所以原假設(shè)成立。

8.6.2一個總體兩個對應(yīng)比較上檢驗

對應(yīng)比較一檢驗是指對同一個總體

的同一個試驗單位,作兩種不同的“處

理”之后出現(xiàn)的結(jié)果進行對應(yīng)比較的方

法。比如,有一個電視機組裝車間,現(xiàn)

研究當引進新的組裝技術(shù)后,其組裝時

間是否比過去的組裝時間有所縮短的

問題。在研究這類問題時我們發(fā)現(xiàn)可以

采用對應(yīng)比較的的方法。因為組裝車間

(總體)沒變,試驗單位(組裝工人)

也沒變,所以測定過去的組裝方法與新

的組裝方法的生產(chǎn)效率問題時,可以利

用對同一個試驗單位的兩種不同的處

理結(jié)果,作簡單的一分析。

①資料:設(shè)分。2,”是同一個總體中,〃

個對應(yīng)樣本(X,,匕)之差(。尸X

且對應(yīng)樣本的平均數(shù)(5)和標準差(5。)

定義如下。

對應(yīng)樣本的平均數(shù):

D=ET???(8-18)

對應(yīng)樣本的標準差:

2

(。-萬)???(8-19)

〃一1

②假設(shè):假定口,小,…,2相互獨立,且

和平均數(shù)2i具有相同的分布。當對應(yīng)

樣本是小樣本(n<30)時,有必要檢驗

是否服從正態(tài)分布,但對大樣本

(n>30),不必檢驗。

③提出原假設(shè):對應(yīng)樣本無差異,即

“():〃x二〃y或。二0

④檢驗統(tǒng)計量:

DyjnD

???(8-20)

sD/VHSD

⑤檢驗統(tǒng)計決策

若原假設(shè)成立,則檢驗統(tǒng)計量服從自

由度為〃T的l分布。在顯著性水平a

條件下,對不同的替換假設(shè),有不同的

統(tǒng)計決策。

Hi:Av>Av如果T*>3『一」則原假

設(shè)被否定(右單側(cè)檢驗)。

"1:4<A如果則原假

設(shè)%被否定(左單側(cè)檢驗)。

H1:豐".、如果|廠|>ta/2,n-1,則原假

設(shè)“。被否定(雙側(cè)檢驗)。

⑥P-值及統(tǒng)計決策

值是檢驗樣本和原假設(shè)之間一

致性程度的尺度。,-值可根據(jù)邏輯對立

假設(shè)計算。,二右單側(cè)檢驗;

17)ta,nT值等于自由度為nT的t-分布的a><100%。

,二P(5b)-左單根!I檢驗;P=2P

(金一1>|7*|)-雙側(cè)檢驗??梢岳脵z驗

統(tǒng)計量T*的〃-值和顯著性水平a相互

比較的方法,作出統(tǒng)計決策。在SAS統(tǒng)

計分析程序中,SAS軟件自動把統(tǒng)計量

〃值換算成相應(yīng)的〃-值。如果。-值大

于顯著性水平4,則原假設(shè)成立。如果

值小于顯著性水平則原假設(shè)被否

定。

例8-12:某電器組裝車間研究引進新的組裝方法后,

組裝A產(chǎn)品的數(shù)量是否有所提高。于是他們從組裝A

產(chǎn)品的工人中隨機抽出15人,進行一個月的新組裝技

術(shù)培訓(xùn)后,和過去的組裝方法作了比較。其資料見表

8-3(?=0.05)o

(表8-3)兩種組裝方法的生產(chǎn)量(臺)

生產(chǎn)工人123456789101112131415

舊組裝方法342829452627241515272331203520

新組裝方法33365041374139212037211829

①提出原假設(shè)。

②兩種組裝方法的生產(chǎn)量差異變量(X,-匕),是

否服從正態(tài)分布。

③試求。的平均數(shù)和標準差。

④試求檢驗統(tǒng)計量及P-值,并解釋其結(jié)果。

解:對新的變量。的正態(tài)分布分析,提出原假設(shè)及替換

假設(shè)。

"o:。服從正態(tài)分布〃|:。不服從正態(tài)分布。

□SASPROGRAM

DATAexampl13;

INPUTXY

D=X-Y;

CARDS;

34332836295045412637274124391521

1520273723213118202935382027

RUN;

PROCUNIVARIATENORMAL;一計算檢驗統(tǒng)計量p-值,并分

析D的分布是否服從正態(tài)分布

VARD;一打印出變量D的描述性統(tǒng)計量,而且可計

算對樣本的t檢驗統(tǒng)計量。

RUN;

口運行結(jié)果及解釋:

UnivariateProcedure

Variable=D

Moments

Quantiles(Def=5)

N15SumWgts15100%Max

1399%13

Mean-5.93333Sum-8975%Q3

195%13

StdDev8.489209Variance72.0666750%Med

-790%4

Skewness0.498342Kurtosis0.6349125%QI

-1110%-15

USS1537CSS1008.9330%Min

-215%-21

CV-143.077StdMean2.191904

1%-21

T:Mean=0-2.70693Pr>|T|0.0170

Range34

Num'=015Num>04Q3-Q1

12

M(Sign)-3.5Pr>=|M|0.1185Mode

-21

SgnRank-41Pr>=|S|0.0181

W:Normal0.978148Pr<W0.9275

□運行結(jié)果的解釋

從計算結(jié)果中可知,正態(tài)分布檢驗統(tǒng)計量為

W=0.9275,其p值=0.978148o比顯著性水準a=0.05

大得多,因此接受原假設(shè)。即新的變量D服從正態(tài)分

布,可以對對應(yīng)樣本進行「檢定。對對應(yīng)樣本,提出

原假設(shè)及替換假設(shè)。

Ho:ux=uy(或D=0),H1:ux<uy(或D<0)

過去的組裝方法(X)和新的組裝方法(Y)的差異

變量D=X-Y的平均數(shù)為Mean=-5.93333,標準差為Std

Dev=8.489209o所以新組裝方法的生產(chǎn)量比過去的生

產(chǎn)量大。對應(yīng)樣本的檢驗統(tǒng)計量7*=-2.707,其,值

=0.0170。因本題是單側(cè)(右側(cè))檢驗,故P/2=0.0085o

這比顯著性水準a=0.05小得多,因此原假設(shè)被拒絕,

接受替換假設(shè),即引進新的組裝方法,其生產(chǎn)量將有

顯著的提高。

8.6.3兩個總體平均差檢驗

在許多情況下,人們需要比較兩個

總體參數(shù),看它們是否有顯著的區(qū)別。

平均差”檢驗就是分析兩個不同總體

平均數(shù)之間的差異。例如,檢驗兩種家

電產(chǎn)品的平均壽命差,用兩種方法所生

產(chǎn)出來的某種產(chǎn)品的平均耐磨強度的

差異,同一種教學(xué)方法在不同的年級或

不同內(nèi)容的課程中是否有不同的效果

等。對此,我們可利用平均差的”檢驗

尋找答案。

如果無法直接得到總體平均數(shù)差

的數(shù)據(jù)時,可以根據(jù)樣本數(shù)據(jù)來估計。

為了檢驗兩個不同總體平均數(shù)之間的

差異,首先要檢驗兩個總體的方差是否

相等。若兩個總體的方差相等,可直接

對其兩個樣本進行”檢驗。如果兩個總

體的方差不相等,要作Satterthwaite

Testo進行平均差”檢驗的步驟如下:

①資料:設(shè)有兩個樣本容量分別為

nx,叼的兩組隨機變量X1,X2,…,X”,

匕名,…,工兩個樣本的平均數(shù)和標準差

分別為H、9、Sx、Sy其兩個樣本的合

標準差為

_?T)"+(%T)s;

3-X(y1)+(4一1)…

(8-21)

②假定:假設(shè)兩個樣本都是從服從正

態(tài)分布的總體中隨機抽取的“,并且兩

個總體方差相等。肩二CT;

③提出原假設(shè)和替換假設(shè):

H0:"x=4yH1?〃x。"Y

④確定檢驗統(tǒng)計量:

%一y

SpJl/%+1/%,…(8-22)

若接受原假設(shè),則檢驗統(tǒng)計量的分布

19)當某總體服從正態(tài)分布時,其樣本的平均數(shù)也服從正態(tài)分布。

服從自由度為OX+〃L2)的"分布。

在顯著性水準戊條件下,對不同的替換

假設(shè),有不同的統(tǒng)計決策。

⑤檢驗統(tǒng)計決策:

Hi>Ay如果7*>L+.,_2,則原假

設(shè)名被拒絕(右單側(cè)檢驗)。

Hl:4Ov如果r*〈-九+"廠2,則原假

設(shè)”。被拒絕(左單側(cè)檢驗)。

H、:4W%如果|廠|>%+『,則原假

設(shè)名被拒絕(雙側(cè)檢驗)。

⑥〃-值及檢驗統(tǒng)計決策:〃-值是檢驗

資料和原假設(shè)之間一致性程度的尺度。

P-值可根據(jù)邏輯對立假設(shè)計算。

P=P(兀+“廠2>r)

P—P(乙+"一2<7*)

P=P(W2>|r|)

如果P-值>a,則原假設(shè)"。被接受;

如果P-值<1,則原假設(shè)名被拒絕。

如果兩個總體的方差不相等(城7或),

則需要作SatterthwaiteTest,

其檢驗統(tǒng)計量為

T*無一歹

1=I=

(8-23)

若接受原假設(shè),則檢驗統(tǒng)計量的分

布服從自由度為了的'分布,自由度/

可由Satterthwaite的自由度近似計

算公式算出。

f=({/4+1/%)2

(―-.T+($/")及T)

(8-24)

因此,對兩個方差不相等的總體,

按以上的方法計算檢驗統(tǒng)計量P-值時,

以自由度一代替自由度〃x+勺-2就可

以了。

8.6.4PROCTTEST

TTEST程序旨在對SAS文件中的兩

個平均數(shù)執(zhí)行t檢定。適用于兩個獨立

的樣本的t檢驗。

PROCTTEST含四道指令,一般格式

如下:

PROCTTESTOPTION;

CLASS變量;

VAR變量;

BY變量;

1)class變量;

用class語句識別分析變量所屬的

類別,因此class語句后指定的變量只

可有兩個值,如果此變量的值是文字型

的,則長度不能超過十六個字母。

2)var變量;

指明對哪些變量的平均數(shù)進行t檢

定。若省略此指令,貝!Jsas對文件內(nèi)所

有數(shù)值變量(class指定的除外)執(zhí)行

t檢定。

3)by變量;

此指令按照所列舉的變量把文件

分成幾個小的文件,然后對每一個小的

文件執(zhí)行t檢定。當選用此指令時,文

件內(nèi)的數(shù)據(jù)必須先按照by后指定的變

量的值由大到小重新排列,可借助proc

sort來完成。

例8-13:某公司根據(jù)個人的業(yè)績及業(yè)務(wù)能力,發(fā)給職

工特別獎金。為了分析在相同的業(yè)績及業(yè)務(wù)能力組中,

男職工和女職工的獎金是否有顯著的差別,隨機抽出

18名男職工和15名女職工作了調(diào)查。其調(diào)查資料如表

8-4o特別獎金是按一年總工資額的百分數(shù)來表示,顯

著性水平是a=0.05O

①提出原假設(shè)和替換假設(shè)。

②試計算男女職工的描述性統(tǒng)計量。

③試檢驗兩個總體(男女)的方差是否相等。

④試檢驗發(fā)給男職工和女職工的特別獎金額,是否

有顯著的差異。

(表8-4))男女特別獎金資料

性特別獎金(%)

女9.27.711.96.29.08.46.97.67.48.09.96.78.49.39.1.~7

(X)

10.48.911.712.08.79.49.89.09.29.79.18.87.99.910.09.310.412.0

(Y)

□SASPROGRAM

DATAexampl3;

INPUTXY@@;一①3名女職工的獎金將出現(xiàn)空白(missing

value),用點'來表示。

CARDS;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論