單樣本K-S檢驗(yàn)_第1頁
單樣本K-S檢驗(yàn)_第2頁
單樣本K-S檢驗(yàn)_第3頁
單樣本K-S檢驗(yàn)_第4頁
單樣本K-S檢驗(yàn)_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、SPSS 16實(shí)用教程第第10章章 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)10.4.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:定義:K-SK-S(Kolmogorov-SmirnovKolmogorov-Smirnov)檢驗(yàn))檢驗(yàn)它是檢驗(yàn)單一樣本是否來自某一特定分布的方它是檢驗(yàn)單一樣本是否來自某一特定分布的方法。法。它的檢驗(yàn)方法它的檢驗(yàn)方法是以樣本數(shù)據(jù)的累計(jì)頻數(shù)分布與是以樣本數(shù)據(jù)的累計(jì)頻數(shù)分布與特定理論分布比較,若兩者間的差距很小,則特定理論分布比較,若兩者間的差距很小,則推論該樣本取自某特定分布族。推論該樣本取自某特定分布族。假設(shè)檢驗(yàn)問題:假設(shè)檢驗(yàn)問題:H0:樣本所來自的總體分布服從某特定分布

2、樣本所來自的總體分布服從某特定分布H1:樣本所來自的總體分布不服從某特定分布樣本所來自的總體分布不服從某特定分布F0(x)表示理論分布的分布函數(shù),表示理論分布的分布函數(shù),F(xiàn)n(x)表示表示一組隨機(jī)樣本的累計(jì)頻率函數(shù)。一組隨機(jī)樣本的累計(jì)頻率函數(shù)。設(shè)設(shè)D為為F0(x)與與Fn(x)差距的最大值,定義如下差距的最大值,定義如下式:式:D=max|Fn(x)-F0(x)|結(jié)論:結(jié)論:當(dāng)實(shí)際觀測當(dāng)實(shí)際觀測DD(n,)(D(n,)是顯著是顯著水平為水平為樣本容量為樣本容量為n時,時,D的拒絕臨界值),的拒絕臨界值),則拒絕則拒絕H0,反之則接受反之則接受H0假設(shè)。假設(shè)。D(n, )的簡略表的簡略表以以Ko

3、lmogorov-Smirnov正態(tài)性檢驗(yàn)為例介正態(tài)性檢驗(yàn)為例介紹它的統(tǒng)計(jì)原理。紹它的統(tǒng)計(jì)原理。例例1:35位健康男性在未進(jìn)食前的血糖濃度如位健康男性在未進(jìn)食前的血糖濃度如表所示,試測驗(yàn)這組數(shù)據(jù)是否來自正態(tài)分布表所示,試測驗(yàn)這組數(shù)據(jù)是否來自正態(tài)分布87 77 92 68 80 78 84 77 81 80 80 77 92 86 76 80 81 75 77 72 81 72 84 86 80 68 77 87 76 77 78 92 75 80 78 n=35檢驗(yàn)過程如下:檢驗(yàn)過程如下:H0:健康成人男性血糖濃度服從正態(tài)分布健康成人男性血糖濃度服從正態(tài)分布H1: 健康成人男性血糖濃度不服從正

4、態(tài)分布健康成人男性血糖濃度不服從正態(tài)分布經(jīng)計(jì)算,樣本的均值經(jīng)計(jì)算,樣本的均值=80,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差=6,這,這便可以作為對原假設(shè),正態(tài)分布的參數(shù)估計(jì)便可以作為對原假設(shè),正態(tài)分布的參數(shù)估計(jì)值,運(yùn)用于檢驗(yàn)計(jì)算中。值,運(yùn)用于檢驗(yàn)計(jì)算中。D值序列的計(jì)算結(jié)果值序列的計(jì)算結(jié)果得到得到D統(tǒng)計(jì)統(tǒng)計(jì)量的值為量的值為0.1754.然然后查表判斷后查表判斷是否拒絕原是否拒絕原假設(shè)假設(shè)2檢驗(yàn)與Kolmogorov-Smirnov檢驗(yàn)的區(qū)別2檢驗(yàn)與檢驗(yàn)與Kolmogorov-Smirnov檢驗(yàn)都采用檢驗(yàn)都采用實(shí)際頻數(shù)和期望頻數(shù)進(jìn)行檢驗(yàn)。它們之間最實(shí)際頻數(shù)和期望頻數(shù)進(jìn)行檢驗(yàn)。它們之間最大的區(qū)別在于前者主要用于類別數(shù)據(jù),而

5、后大的區(qū)別在于前者主要用于類別數(shù)據(jù),而后者主要用于有單位的數(shù)量數(shù)據(jù),有時前者也者主要用于有單位的數(shù)量數(shù)據(jù),有時前者也可以用于數(shù)量數(shù)據(jù)但必須將數(shù)據(jù)分組得到實(shí)可以用于數(shù)量數(shù)據(jù)但必須將數(shù)據(jù)分組得到實(shí)際觀測頻數(shù),并要求多變量之間獨(dú)立,而后際觀測頻數(shù),并要求多變量之間獨(dú)立,而后者可以不分組直接把原始數(shù)據(jù)進(jìn)行檢驗(yàn)因此者可以不分組直接把原始數(shù)據(jù)進(jìn)行檢驗(yàn)因此k-s檢驗(yàn)對數(shù)據(jù)的應(yīng)用較完整。檢驗(yàn)對數(shù)據(jù)的應(yīng)用較完整。 SPSS SPSS在統(tǒng)計(jì)中將計(jì)算在統(tǒng)計(jì)中將計(jì)算K-SK-S的的Z Z統(tǒng)計(jì)量,并統(tǒng)計(jì)量,并依據(jù)依據(jù)K-SK-S分布表(小樣本)或正態(tài)分布表(大分布表(小樣本)或正態(tài)分布表(大樣本)給出對應(yīng)的相伴概率值。

6、如果相伴概率樣本)給出對應(yīng)的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平小于或等于用戶的顯著性水平,則應(yīng)拒絕零,則應(yīng)拒絕零假設(shè)假設(shè)H0H0,認(rèn)為樣本來自的總體與指定的分布有,認(rèn)為樣本來自的總體與指定的分布有顯著差異;如果相伴概率值大于顯著性水平,顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設(shè)則不能拒絕零假設(shè)H0H0,認(rèn)為樣本來自的總體與,認(rèn)為樣本來自的總體與指定的分布無顯著差異。指定的分布無顯著差異。單樣本單樣本K-SK-S檢驗(yàn)可以將一個變量的實(shí)際頻數(shù)分檢驗(yàn)可以將一個變量的實(shí)際頻數(shù)分布與正態(tài)分布(布與正態(tài)分布(NormalNormal)、均勻分布)、均勻分布(UniformUn

7、iform)、泊松分布()、泊松分布(PoissonPoisson)、指數(shù))、指數(shù)(ExponentialExponential)分布進(jìn)行比較。)分布進(jìn)行比較。10.4.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程 研究問題研究問題 某地某地144144個周歲兒童身高數(shù)據(jù)如表個周歲兒童身高數(shù)據(jù)如表10-410-4所所示,問該地區(qū)周歲兒童身高頻數(shù)是否呈正態(tài)分示,問該地區(qū)周歲兒童身高頻數(shù)是否呈正態(tài)分布?布? 身身 高高 區(qū)區(qū) 間間人人 數(shù)數(shù)642684697701671207225732474227616782796831 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟有四種可有四種可作為原假作為原假設(shè)中理論設(shè)中理論分布的分分布的分布類型

8、布類型Options選項(xiàng)和精選項(xiàng)和精確檢驗(yàn)選確檢驗(yàn)選項(xiàng)。項(xiàng)。10.4.3 結(jié)果和討論結(jié)果和討論(1 1)本例輸出結(jié)果如下表所示。)本例輸出結(jié)果如下表所示。D統(tǒng)計(jì)量的數(shù)值統(tǒng)計(jì)量的數(shù)值Z值等于值等于D*sqrt(n)近似近似相伴概率值等于相伴概率值等于0.681大于我們一般的大于我們一般的顯著水平顯著水平0.05,則接受,則接受原假設(shè),認(rèn)為學(xué)生身高原假設(shè),認(rèn)為學(xué)生身高頻數(shù)服從正態(tài)分布。頻數(shù)服從正態(tài)分布。注意:在樣本注意:在樣本數(shù)少于數(shù)少于50時,時,要求使用精確要求使用精確檢驗(yàn)概率值。檢驗(yàn)概率值。作業(yè)!要求作業(yè)中,在進(jìn)行要求作業(yè)中,在進(jìn)行K-S檢驗(yàn)時,結(jié)果中需要含有檢驗(yàn)時,結(jié)果中需要含有表明值計(jì)算

9、過程的表格(包括累積頻率,理論累表明值計(jì)算過程的表格(包括累積頻率,理論累積分布函數(shù),值序列并指明積分布函數(shù),值序列并指明D 統(tǒng)計(jì)量的值),最統(tǒng)計(jì)量的值),最后運(yùn)用后運(yùn)用spss計(jì)算的相伴概率值,給出檢驗(yàn)結(jié)果。計(jì)算的相伴概率值,給出檢驗(yàn)結(jié)果。1.對于例一的正態(tài)性檢驗(yàn)問題,運(yùn)用對于例一的正態(tài)性檢驗(yàn)問題,運(yùn)用k-s檢驗(yàn)的方法檢驗(yàn)的方法進(jìn)行檢驗(yàn)。進(jìn)行檢驗(yàn)。2.運(yùn)用運(yùn)用k-s檢驗(yàn)方法檢驗(yàn)研究問題中,兒童的身高檢驗(yàn)方法檢驗(yàn)研究問題中,兒童的身高(不是身高頻數(shù)不是身高頻數(shù),處理數(shù)據(jù)時,如:處理數(shù)據(jù)時,如:“64”按按“64”處理處理)是否服從正態(tài)分布。)是否服從正態(tài)分布。3.據(jù)一家商場的調(diào)查報(bào)告記載了該商場一位售貨員據(jù)一家商場的調(diào)查報(bào)告記載了該商場一位售貨員在一個工作日內(nèi)接待的在一個工作日內(nèi)接待的110位顧客中花費(fèi)在每一位位顧客中花費(fèi)在每一位顧客的服務(wù)時間(單位:秒),如下表所示。根據(jù)數(shù)顧客的服務(wù)時間(單位:秒),如下表所示。根據(jù)數(shù)據(jù)據(jù)分別用卡方檢驗(yàn)和分別用卡方檢驗(yàn)和K-S檢驗(yàn),卡方檢驗(yàn)檢驗(yàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論