




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
SPSS之平均數(shù)比較與T檢驗(yàn)第1頁/共49頁
假設(shè)檢驗(yàn)是非常重要的一類統(tǒng)計(jì)推斷問題。假設(shè)檢驗(yàn)技術(shù)不僅可以對(duì)總體分布的某些參數(shù),而且也可以對(duì)總體本身的分布做出假設(shè),通過對(duì)樣本的統(tǒng)計(jì)分析來判定該假設(shè)是否成立,從而對(duì)總體分布給以進(jìn)一步的確認(rèn)。如:已知樣本來自正態(tài)總體,是否有理由說它是來自均值為的正態(tài)總體;再如,已知兩個(gè)相互獨(dú)立的樣本,分別來自兩個(gè)正態(tài)總體,能否說這兩個(gè)總體均值相同或方差相同。第2頁/共49頁假設(shè)檢驗(yàn)中的幾個(gè)基本概念1.原假設(shè)與備擇假設(shè)2.兩類錯(cuò)誤3.檢驗(yàn)統(tǒng)計(jì)量4.拒絕域與臨界值5.顯著性水平第3頁/共49頁例:一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm,為對(duì)生產(chǎn)過程進(jìn)行控制,質(zhì)量監(jiān)測(cè)人員定期對(duì)一臺(tái)加工機(jī)床檢查,確定這臺(tái)機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過程不正常,必須進(jìn)行調(diào)整。試陳述用來檢驗(yàn)生產(chǎn)過程是否正常的原假設(shè)和備擇假設(shè)。解:建立的原假設(shè)和備擇假設(shè)為
H0
:u=10cmH1
:u≠10cm第4頁/共49頁1. 第Ⅰ類錯(cuò)誤(棄真錯(cuò)誤)原假設(shè)為真時(shí)拒絕原假設(shè)第Ⅰ類錯(cuò)誤的概率記為被稱為顯著性水平2. 第Ⅱ類錯(cuò)誤(取偽錯(cuò)誤)原假設(shè)為假時(shí)未拒絕原假設(shè)第Ⅱ類錯(cuò)誤的概率記為假設(shè)檢驗(yàn)中的兩類錯(cuò)誤第5頁/共49頁兩類錯(cuò)誤的關(guān)系N一定,不能同時(shí)減少兩類錯(cuò)誤!和的關(guān)系就像翹翹板,小就大,大就小第6頁/共49頁拒絕域與臨界值第7頁/共49頁
假設(shè)檢驗(yàn)的目的在于判斷樣本統(tǒng)計(jì)量與假設(shè)的總體參數(shù)之間的差異。不同的抽樣方法對(duì)應(yīng)著不同的標(biāo)準(zhǔn)。顯著性水平就是用來判斷接受和拒絕原假設(shè)的標(biāo)準(zhǔn),通常用表示。1.在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率為零。2.在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)。3.
由研究者事先確定。第8頁/共49頁假設(shè)檢驗(yàn)的步驟1.根據(jù)具體問題的要求,建立原假設(shè)H0和備擇假設(shè)H1。2.選擇一個(gè)合適的檢驗(yàn)統(tǒng)計(jì)量,它應(yīng)與原假設(shè)有關(guān),而且當(dāng)原假設(shè)H0為真時(shí)統(tǒng)計(jì)量的分布已知。3.給定顯著性水平,當(dāng)原假設(shè)H0為真的,求出臨界值。4.由樣本觀測(cè)值計(jì)算檢驗(yàn)統(tǒng)計(jì)量的數(shù)值,按檢驗(yàn)規(guī)則,對(duì)原假設(shè)作出拒絕或接受的判斷。注:當(dāng)總體標(biāo)準(zhǔn)差未知時(shí)一般采用T分布檢驗(yàn);當(dāng)總體標(biāo)準(zhǔn)差已知時(shí)一般采用正態(tài)分布檢驗(yàn)。第9頁/共49頁SPSS的輸出結(jié)果中給出了相應(yīng)檢驗(yàn)統(tǒng)計(jì)量的實(shí)際取值,但由于顯著性水平根據(jù)不同要求而有所不同,SPSS并不給出臨界值。如果不查概率表,就無法直接采用上面的步驟進(jìn)行檢驗(yàn)。SPSS給出了檢驗(yàn)統(tǒng)計(jì)量的概值即文獻(xiàn)中常見的p
值(p-value),或稱為相伴概率。利用p
值就可以直接進(jìn)行檢驗(yàn)。p
值是在零假設(shè)成立的情況下,檢驗(yàn)統(tǒng)計(jì)量的取值等于或超過檢驗(yàn)統(tǒng)計(jì)量的實(shí)際值的概率,從而p
值即為否定零假設(shè)的最低顯著性水平。p值經(jīng)常被稱為實(shí)際顯著性水平,以區(qū)別于給定的顯著性水平第10頁/共49頁當(dāng)p
<時(shí),意味著如果給定一個(gè)真實(shí)的零假設(shè),那么檢驗(yàn)統(tǒng)計(jì)量的取值等于或超過實(shí)際觀察到的極端值的概率為。大多數(shù)學(xué)者都把這一結(jié)果解釋為支持你否定零假設(shè)而接受替代假設(shè)的證據(jù)。有學(xué)者稱p值為“實(shí)驗(yàn)使零假設(shè)相信者感到吃驚的程度的度量”。p值越小,零假設(shè)相信者吃驚的程度越高。為了便于記憶,我們可以把p
值理解為零假設(shè)的支持率或可信程度。當(dāng)p<時(shí),我們拒絕零假設(shè),如在0.05的顯著水平下,如果p<0.05,我們就可以否定零假設(shè)。在進(jìn)行單側(cè)檢驗(yàn)時(shí),需要比較和的大小。第11頁/共49頁SPSS提供了計(jì)算指定變量的綜合描述統(tǒng)計(jì)量的過程和對(duì)均值進(jìn)行比較檢驗(yàn)的過程:(1)用于計(jì)算變量的綜合統(tǒng)計(jì)量的Means過程
[Analyze]=>[CompareMeans]=>[Means]
(2)用于單獨(dú)樣本的t檢驗(yàn)過程
[Analyze]=>[CompareMeans]=>[One-SampleTTest]
第12頁/共49頁
(3)用于獨(dú)立樣本的t檢驗(yàn)過程
[Analyze]=>[CompareMeans]=>[Independent-SamplesTTest]
用于檢驗(yàn)是否兩個(gè)不相關(guān)的樣本來自具有相同均值的總體。(4)用于配對(duì)樣本的t檢驗(yàn)過程
[Analyze]=>[CompareMeans]=>[Paired-SamplesTTest]
用于檢驗(yàn)兩個(gè)相關(guān)的樣本是否來自具有相同均值的總體。第13頁/共49頁1、分組平均數(shù)的比較第14頁/共49頁第15頁/共49頁“DependentList”選項(xiàng)框中選入的是因變量,可直接用來計(jì)算各級(jí)平均數(shù)?!癐ndependentList”選項(xiàng)框中入選的是獨(dú)立變量,即“分組變量”,此時(shí)要清楚是平行的分組變量還是層疊分組變量。如:若同時(shí)按照年齡、性別分組情況下的年經(jīng)濟(jì)收入是平行分組;先按不同性別分組,再按年齡分組情況下的年經(jīng)濟(jì)收入是層疊分組。并行分組時(shí)同時(shí)輸入性別和年齡變量;而層疊分組應(yīng)先輸入性別變量,單擊“Next”按鈕,再輸入年齡變量。第16頁/共49頁2、單一樣本T檢驗(yàn)
單樣本T檢驗(yàn)是指樣本平均與總體平均數(shù)的差異檢驗(yàn)。樣本平均數(shù)()與總體平均數(shù)μ往往大小不一,這差異是由于抽樣誤差造成,還是本質(zhì)性誤差—樣本根本不是來源于該總體。如果差異顯著,則認(rèn)為樣本平均數(shù)與總體平均數(shù)μ的差異已不能完全認(rèn)為是抽樣誤差了。第17頁/共49頁對(duì)于單個(gè)正態(tài)總體,常用T統(tǒng)計(jì)量來檢驗(yàn)樣本均數(shù)是否等于總體平均數(shù)即
若計(jì)算的T統(tǒng)計(jì)量大于等于,或相伴概率小于,則認(rèn)為在顯著性水平下,樣本統(tǒng)計(jì)量落入拒絕域,所以拒絕原假設(shè);反之,則不能拒絕原假設(shè)。第18頁/共49頁Analyze CompareMeans OneSampleTtest第19頁/共49頁第20頁/共49頁第21頁/共49頁在“TestVariables”選項(xiàng)框中輸入需要檢驗(yàn)的變量。在“TestValue”輸入一個(gè)值作為假設(shè)檢驗(yàn)值。在“Options”對(duì)話框中,還可以輸出置信區(qū)間,一般取為90%,95%,99%等。以及缺失值的處置方式。第22頁/共49頁例1、以“Employeedata.sav”為資料,計(jì)算公司職工的平均受教育年數(shù),假定該地區(qū)人口平均受教育年數(shù)為13年,現(xiàn)問,公司職工文化程度是否等同于居民文化程度?其中,顯著性水平為
=0.05第23頁/共49頁
統(tǒng)計(jì)量觀測(cè)值為t=3.71,自由度為df=473,雙尾概率P值為Sig=0.000<
,拒絕原假設(shè),平均受教育年數(shù)不等于13年。實(shí)際上,樣本平均數(shù)與總體平均數(shù)的差異為0.492,以95%的可靠性估計(jì)平均數(shù)在(13.23,13.75)之間,確實(shí)不包含13。第24頁/共49頁
例2、某省大學(xué)英語四級(jí)考試的平均成績(jī)?yōu)?5分,現(xiàn)從某校隨機(jī)抽取20份試卷,其分?jǐn)?shù)為:7276687862596485707561748783547656666862。問該校英語水平與全區(qū)是否基本一致。其中,顯著性水平為
=0.05
。第25頁/共49頁
例3、某企業(yè)生產(chǎn)的零件直徑服從正態(tài)分布,從中抽取5件測(cè)得直徑分別為:22.3,21.5,22.0,21.8,21.4。問零件的平均直徑是否為21。其中,顯著性水平為
=0.05
。第26頁/共49頁練習(xí)題利用住房狀況調(diào)查數(shù)據(jù),推斷家庭人均住房面積的平均值是否為20平方米。其中,顯著性水平為
=0.05。利用保險(xiǎn)公司人員構(gòu)成的數(shù)據(jù),推斷35歲以下年輕人所占比例的平均值與0.5有無顯著差異。推斷具有大專及其以上教育水平的員工的平均比例是否不低于0.8。其中,顯著性水平為
=0.05。第27頁/共49頁3、兩獨(dú)立樣本平均數(shù)差異T檢驗(yàn)
獨(dú)立樣本(IndependentSample)是指兩個(gè)樣本彼此獨(dú)立,沒有任何關(guān)聯(lián)。例如實(shí)驗(yàn)組與控制組、男生組與女生組、高收入組與低收入組、大學(xué)數(shù)學(xué)系與物理系等。利用來自兩個(gè)總體的獨(dú)立樣本,推斷兩個(gè)總體的均值是否存在顯著差異。兩個(gè)獨(dú)立樣本均值之間差異用T統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。
第28頁/共49頁Analyze CompareMeans IndependentSampleTtest例4、第29頁/共49頁
例4:用“Employeedata.sav”資料,問:清潔工(jobcat=1)的受教育年數(shù)與保管員(jobcat=2)和經(jīng)理(jobcat=3)的受教育年數(shù)是否有顯著差異?其中,顯著性水平為
=0.05
。第30頁/共49頁第31頁/共49頁在“TestVariables”選項(xiàng)框中加入要檢驗(yàn)的變量。在“GroupingVariable”選項(xiàng)框中輸入分組變量,此時(shí)可以通過“DefineGroups”定義分組值,其中,“Usespecifiedvalues”是選擇合適的第一組、第二組分組變量值?!癈utpoint”是輸入一個(gè)臨界點(diǎn)值,將數(shù)據(jù)分為兩組,大于等于該分組值的case屬于同一個(gè)組,其余的為另外一個(gè)組。第32頁/共49頁第33頁/共49頁第34頁/共49頁第35頁/共49頁第36頁/共49頁
結(jié)果分析:1、由上表中可以看出前者為111人,平均受教育年數(shù)分別為15.53,后者363人,平均受教育年數(shù)為12.87,有一定差異。2、第一步:F統(tǒng)計(jì)量的觀測(cè)值為20.93,由于對(duì)應(yīng)的概率P值Sig=0.00<0.05,所以認(rèn)為清潔工與保管員和經(jīng)理之間的受教育年數(shù)兩總體方差有顯著差異。由于兩總體方差有差異,所以應(yīng)看第二行(Equalvariancesnotassumed)t檢驗(yàn)的結(jié)果,對(duì)應(yīng)的t觀測(cè)值為7.484,對(duì)應(yīng)的概率P值Sig=0.00<0.05,所以認(rèn)為兩總體的均值有顯著差異。第37頁/共49頁練習(xí)題利用住房狀況調(diào)查數(shù)據(jù),推斷本市戶口總體和外地戶口總體的家庭人均住房面積的平均值是否有顯著差異。利用保險(xiǎn)公司人員構(gòu)成數(shù)據(jù),分析全國性保險(xiǎn)公司與外資合資保險(xiǎn)公司的人員構(gòu)成中具有大專及其以上學(xué)歷的員工比例的均值是否有顯著差異。第38頁/共49頁4、兩配對(duì)樣本平均數(shù)差異T檢驗(yàn)
配對(duì)樣本(PairedSample)或相關(guān)樣本(CorrelatedSample),指兩個(gè)樣本的觀測(cè)值之間彼此有關(guān)聯(lián),如實(shí)驗(yàn)前和實(shí)驗(yàn)后的測(cè)量,研究者感興趣的是二次測(cè)量之間是否存在差異。如為研究某種減肥茶是否有顯著的減肥效果,對(duì)肥胖人群喝茶前后的體重進(jìn)行分析,看均值有無顯著差異。
第39頁/共49頁
兩個(gè)配對(duì)樣本均值之間差異用T統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。配對(duì)樣本檢驗(yàn)就是根據(jù)配對(duì)樣本均值之間的差異,檢驗(yàn)兩個(gè)總體均值是否相等。第40頁/共49頁
在“Paired-SamplesTTest”對(duì)話框中定義要比較的變量對(duì),如,員工的目前工資與起始工資。第41頁/共49頁Analyze CompareMeans Paired-SamplesTtest例5、第42頁/共49頁例5、用“Employeedata.sav”資料,分析美國企業(yè)現(xiàn)在工資與過去工資是否有明顯差異。第43頁/共49頁第44頁/共49頁由于Sig=0.000,所以原假設(shè)不成立,既可以認(rèn)為目前工資與開始
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 孕婦用藥安全知識(shí)培訓(xùn)課件
- 貴陽銀行面試經(jīng)驗(yàn)分享:不同崗位面試題目的應(yīng)對(duì)策略
- 娛樂主播基本知識(shí)培訓(xùn)課件
- 女性私密保養(yǎng)課件教學(xué)
- 媒體內(nèi)容轉(zhuǎn)載協(xié)議
- 2025年工業(yè)互聯(lián)網(wǎng)平臺(tái)光通信技術(shù)升級(jí)方案與實(shí)施路徑報(bào)告
- 人工智能技術(shù)在智能虛擬現(xiàn)實(shí)社交中的應(yīng)用與社交體驗(yàn)創(chuàng)新
- 人工智能技術(shù)在智能數(shù)字孿生工廠建設(shè)中的應(yīng)用與生產(chǎn)優(yōu)化
- 人工智能技術(shù)在智能區(qū)塊鏈供應(yīng)鏈管理中的應(yīng)用與透明度提高
- 人工智能技術(shù)在智能海洋船舶航行安全中的應(yīng)用與風(fēng)險(xiǎn)預(yù)警
- 《2025年CSCO卵巢癌診療指南》更新要點(diǎn)解讀
- 2025年-四川省安全員《A證》考試題庫及答案
- 防治傳染病知識(shí)培訓(xùn)課件
- DBT29-35-2017 天津市住宅裝飾裝修工程技術(shù)標(biāo)準(zhǔn)
- 放射治療技術(shù)規(guī)范標(biāo)準(zhǔn)
- 【物理】第九章 壓強(qiáng) 單元練習(xí)+2024-2025學(xué)年人教版物理八年級(jí)下冊(cè)
- 《倉庫消防安全》課件
- (2021)最高法民申5114號(hào)凱某建設(shè)工程合同糾紛案 指導(dǎo)
- 蠟療課件教學(xué)課件
- 九下語文必背內(nèi)容(古詩、文言文、課文)
- 危險(xiǎn)化學(xué)品目錄(2024版)
評(píng)論
0/150
提交評(píng)論