




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
在初等統(tǒng)計學中,最基本的概念是什么?如:總體,樣本,隨機變量,分布,估計和假設檢驗等.其很大一部分內(nèi)容是和正態(tài)理論相關的。在那里,總體的分布形式或分布族往往是給定的或者是假定了的,所不知道的僅僅是一些參數(shù)的值或他們的范圍。(主要工作是什么?)
第一章緒論
§1.1非參數(shù)統(tǒng)計在初等統(tǒng)計學中,最基本的概念是什么?1然而,在實際生活中,那種對總體的分布的假定并不是能隨便做出的。數(shù)據(jù)并不是來自所假定分布的總體;或者,數(shù)據(jù)根本不是來自一個總體;還有可能,數(shù)據(jù)因為種種原因被嚴重污染。這樣,在假定總體分布的情況下進行推斷的做法就可能產(chǎn)生錯誤的結(jié)論。于是,人們希望在不假定總體分布的情況下,盡量從數(shù)據(jù)本身來獲得所需要的信息。這就是非參數(shù)統(tǒng)計的宗旨。然而,在實際生活中,那種對總體的分布的假定并不是能隨便做出的2因為非參數(shù)統(tǒng)計方法不利用關于總體分布的知識,所以,就是在對于總體分布的任何知識都沒有的情況下,它也能很容易而又很可靠地獲得結(jié)論。這時,非參數(shù)方法往往優(yōu)于參數(shù)方法。在不知總體分布的情況下如何利用數(shù)據(jù)所包含的信息呢?一組數(shù)據(jù)的最基本的信息就是次序。如果可以把數(shù)據(jù)點按大小次序排隊,每一個具體數(shù)目都有它的在整個數(shù)據(jù)中(從最小的數(shù)起)的位置或次序,稱為該數(shù)據(jù)的秩(rank)。數(shù)據(jù)有多少個觀察值,就有多少個秩。在一定的假定下,這些秩和它們的統(tǒng)計量的分布是求得出來的,而且和原來的總體分布無關。這樣就可以進行所需要的統(tǒng)計推斷。因為非參數(shù)統(tǒng)計方法不利用關于總體分布的知識,所以,就是在對于3注意:非參數(shù)統(tǒng)計的名字中的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關參數(shù);它被稱為和分布無關(distribution—free),是因為其推斷方法和總體分布無關;不應理解為與所有分布(例如有關秩的分布)無關.什么是非參數(shù)統(tǒng)計?不假定總體分布的具體形式,從數(shù)據(jù)本身獲得所需要的信息,通過推斷方法得到相關結(jié)論的一種分析方法。注意:非參數(shù)統(tǒng)計的名字中的“非參數(shù)(nonparametri4一個典型的參數(shù)檢驗過程1.總體參數(shù)Example:PopulationMean2.假定數(shù)據(jù)的形態(tài)為
WholeNumbersorFractions
Example:HeightinInches(72,60.5,54.7)3.有很強的假定Example:正態(tài)分布,F(xiàn)分布4.例子:ZTest,tTest,2Test一個典型的參數(shù)檢驗過程1.總體參數(shù)5一個例子:對兩組學生進行語法測試,如何比較兩組學生的成績是否存在差異?甲乙25302934242513322430323744332284731403033351821352822一個例子:對兩組學生進行語法測試,如何比較兩組學生的成績是否6原始數(shù)據(jù)秩2530293424251332243032379.514.012.021.07.59.52.017.57.514.017.524.04433228473140303335182135282226.019.55.51.027.016.025.014.019.522.53.04.022.511.05.5原始數(shù)據(jù)秩259.54426.07非參數(shù)檢驗過程1.不涉及總體的分布Example:ProbabilityDistributions,Independence2.數(shù)據(jù)的形態(tài)各異定量數(shù)據(jù)定序數(shù)據(jù)Example:Good-Better-Best名義數(shù)據(jù)Example:Male-Female3.例子:WilcoxonRankSumTest/RunTestF,F,F,F,F,F,F,F,M,M,M,M,M,M,MF,M,F,M,F,M,F,M,F,M,F,M,F,M,F非參數(shù)檢驗過程1.不涉及總體的分布F,F,F,F,F8參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計的比較問題:一種統(tǒng)計方法是否比其它方法更好,通常要從幾個方面來考慮。有效性或效率(efficiency)。在其他條件相同情況下,一種方法需要的樣本容量越小,則效率越高,通常用二者的樣本容量比值來度量相對效率。在假設檢驗中,樣本均值是檢驗總體均值的一個好的檢驗統(tǒng)計量,它對總體均值的不同十分敏感,但是的分布取決于總體的分布,而這通常是未知的。參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計的比較問題:9穩(wěn)健性(robust)。如果一種方法背后的某個假設條件不成立,但它還是近似有效的,則可認為這一方法對這一條件是穩(wěn)健的。通常來說,穩(wěn)健是指基于正態(tài)假設的方法(即使?jié)撛诘目傮w分布是非正態(tài)的)檢驗統(tǒng)計量也有近似相同的零分布。比如單樣本的t檢驗,當樣本容量很大時,對于正態(tài)假設是穩(wěn)健的。沒有一個總體是精確的服從正態(tài)分布或其他已知分布,如果總體是近似正態(tài)分布的,那么基于正態(tài)分布來進行推斷是安全的,反之,我們就要考慮非參數(shù)方法。穩(wěn)健性(robust)。如果一種方法背后的某個假設條件不成立10t檢驗這一方法是穩(wěn)健的,當總體是非正態(tài)分布時,它是否象正態(tài)分布一樣有效?一種方法固然應該是穩(wěn)健的,更應該是有效的。相合性或漸進性(consistent),多數(shù)參數(shù)檢驗對于非正態(tài)分布條件是穩(wěn)健的,相合的,即隨著樣本容量的增加,方法將更為穩(wěn)健,對于無限樣本而言,方法是精確的且不依賴于總體分布。t檢驗這一方法是穩(wěn)健的,當總體是非正態(tài)分布時,它是否象正態(tài)分11對總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。1.假定較少2.不需要對總體參數(shù)的假定3.與參數(shù)結(jié)果接近針對幾乎所有類型的數(shù)據(jù)形態(tài)。容易計算在計算機盛行之前就已經(jīng)發(fā)展起來。非參數(shù)檢驗的優(yōu)點對總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。非參數(shù)檢驗的121. 可能會浪費一些信息特別當數(shù)據(jù)可以使用參數(shù)模型的時候。2. 大樣本手算相當麻煩3. 一些表不易得到非參數(shù)檢驗的弱點因此我們實際上給出了一個沒有實際意義的結(jié)果:沒有一種方法是萬能的。1. 可能會浪費一些信息非參數(shù)檢驗的弱點因此我們實際上給出了13本學期內(nèi)容結(jié)構體系本學期內(nèi)容結(jié)構體系14非參數(shù)統(tǒng)計的主要內(nèi)容內(nèi)容非參數(shù)檢驗相應的參數(shù)檢驗獨立樣本中位數(shù)檢驗秩和檢驗獨立樣本t檢驗2配對樣本/單一樣本符號檢驗Wilcoxon檢驗成對樣本t-檢驗>2獨立樣本Kruskal-Wallis檢驗單一因素ANOVA兩因素Friedman檢驗雙因素ANOVA相關性檢驗Spearman秩相關Pearson相關性檢驗分布的檢驗Kolmogorov-Smirnov非參數(shù)統(tǒng)計的主要內(nèi)容內(nèi)容非參數(shù)檢驗相應的參數(shù)檢驗獨立樣本中位15§1.2順序統(tǒng)計量,秩和線性秩統(tǒng)計量
一、順序統(tǒng)計量因為非參數(shù)方法通常并不假定總體分布。因此,觀測值的順序及性質(zhì)則作為研究的對象。順序統(tǒng)計量:對于樣本X1,X2,X3,…,Xn,如果按照升冪排列,得到稱為第k個順序統(tǒng)計量?!?.2順序統(tǒng)計量,秩和線性秩統(tǒng)計量一、順序統(tǒng)計量稱162、基于順序統(tǒng)計量的統(tǒng)計量中位數(shù)極差3、順序統(tǒng)計量分布函數(shù)設總體的分布函數(shù)F(X),則第r個順序統(tǒng)計量的分布函數(shù)為2、基于順序統(tǒng)計量的統(tǒng)計量中位數(shù)極差3、順序統(tǒng)計量分布函數(shù)17(4)順序統(tǒng)計量密度函數(shù)(如果分布密度存在)(4)順序統(tǒng)計量密度函數(shù)(如果分布密度存在)18同樣我們可以得到順序統(tǒng)計量X(r)和X(s)的聯(lián)合密度函數(shù)為:特別地,極差的分布函數(shù)為:同樣我們可以得到順序統(tǒng)計量X(r)和X(s)的聯(lián)合密度函數(shù)19分位數(shù)對于離散數(shù)據(jù),給定n個值X1,…,Xn,則p分位數(shù)定義為為:定義(連續(xù)分布)分位數(shù)對于離散數(shù)據(jù),給定n個值X1,…,Xn,則p分位數(shù)定義20二、秩統(tǒng)計量1、秩統(tǒng)計量設X1,X2,X3,…,Xn來自總體的樣本,記Ri為樣本點Xi的秩,即樣本中小于或等于Xi的樣本點的個數(shù),即其中
例如:觀測值5.61.42.75.22.64.82.3秩7146352顯然,X(Ri)=X(i),記R=(R1,R2,…,Rn),稱R為由樣本產(chǎn)生的統(tǒng)計量,也稱秩統(tǒng)計量二、秩統(tǒng)計量其中例如:觀測值5.61.42.75.22.21注:有結(jié)點數(shù)據(jù)(重復數(shù)據(jù))的秩定義:設X1,X2,X3,…,Xn來自總體的簡單隨機樣本,將數(shù)據(jù)排序后,相同的數(shù)據(jù)點形成一個結(jié),重復數(shù)據(jù)的個數(shù)為結(jié)長。此時秩定義為對應秩(無重復數(shù)據(jù)時)的平均數(shù)。如:85,87,87,92,83,83,83,95,結(jié)為多少?結(jié)長為多少?對應秩?答案:5個結(jié),結(jié)長為1,2,1,3,1,對應秩為4,5.5,5.5,7,1,2,3,8注:有結(jié)點數(shù)據(jù)(重復數(shù)據(jù))的秩定義:設X1,X2,X3,…,222、秩統(tǒng)計量的分布和數(shù)字特征●
的聯(lián)合分布為:
●
的概率分布為:
●
的數(shù)學期望:●
的方差:●的協(xié)方差:特別地2、秩統(tǒng)計量的分布和數(shù)字特征●的概率分布為:23作業(yè):1,了解非參數(shù)統(tǒng)計的歷史(查閱相關文獻)2,熟悉R作業(yè):1,了解非參數(shù)統(tǒng)計的歷史(查閱相關文獻)24參考書:非參數(shù)統(tǒng)計 吳喜之編著 中國統(tǒng)計出版社實用非參數(shù)統(tǒng)計(第三版)[美]W.J.Conover崔恒建譯人民郵電出版社參考書:非參數(shù)統(tǒng)計25在初等統(tǒng)計學中,最基本的概念是什么?如:總體,樣本,隨機變量,分布,估計和假設檢驗等.其很大一部分內(nèi)容是和正態(tài)理論相關的。在那里,總體的分布形式或分布族往往是給定的或者是假定了的,所不知道的僅僅是一些參數(shù)的值或他們的范圍。(主要工作是什么?)
第一章緒論
§1.1非參數(shù)統(tǒng)計在初等統(tǒng)計學中,最基本的概念是什么?26然而,在實際生活中,那種對總體的分布的假定并不是能隨便做出的。數(shù)據(jù)并不是來自所假定分布的總體;或者,數(shù)據(jù)根本不是來自一個總體;還有可能,數(shù)據(jù)因為種種原因被嚴重污染。這樣,在假定總體分布的情況下進行推斷的做法就可能產(chǎn)生錯誤的結(jié)論。于是,人們希望在不假定總體分布的情況下,盡量從數(shù)據(jù)本身來獲得所需要的信息。這就是非參數(shù)統(tǒng)計的宗旨。然而,在實際生活中,那種對總體的分布的假定并不是能隨便做出的27因為非參數(shù)統(tǒng)計方法不利用關于總體分布的知識,所以,就是在對于總體分布的任何知識都沒有的情況下,它也能很容易而又很可靠地獲得結(jié)論。這時,非參數(shù)方法往往優(yōu)于參數(shù)方法。在不知總體分布的情況下如何利用數(shù)據(jù)所包含的信息呢?一組數(shù)據(jù)的最基本的信息就是次序。如果可以把數(shù)據(jù)點按大小次序排隊,每一個具體數(shù)目都有它的在整個數(shù)據(jù)中(從最小的數(shù)起)的位置或次序,稱為該數(shù)據(jù)的秩(rank)。數(shù)據(jù)有多少個觀察值,就有多少個秩。在一定的假定下,這些秩和它們的統(tǒng)計量的分布是求得出來的,而且和原來的總體分布無關。這樣就可以進行所需要的統(tǒng)計推斷。因為非參數(shù)統(tǒng)計方法不利用關于總體分布的知識,所以,就是在對于28注意:非參數(shù)統(tǒng)計的名字中的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關參數(shù);它被稱為和分布無關(distribution—free),是因為其推斷方法和總體分布無關;不應理解為與所有分布(例如有關秩的分布)無關.什么是非參數(shù)統(tǒng)計?不假定總體分布的具體形式,從數(shù)據(jù)本身獲得所需要的信息,通過推斷方法得到相關結(jié)論的一種分析方法。注意:非參數(shù)統(tǒng)計的名字中的“非參數(shù)(nonparametri29一個典型的參數(shù)檢驗過程1.總體參數(shù)Example:PopulationMean2.假定數(shù)據(jù)的形態(tài)為
WholeNumbersorFractions
Example:HeightinInches(72,60.5,54.7)3.有很強的假定Example:正態(tài)分布,F(xiàn)分布4.例子:ZTest,tTest,2Test一個典型的參數(shù)檢驗過程1.總體參數(shù)30一個例子:對兩組學生進行語法測試,如何比較兩組學生的成績是否存在差異?甲乙25302934242513322430323744332284731403033351821352822一個例子:對兩組學生進行語法測試,如何比較兩組學生的成績是否31原始數(shù)據(jù)秩2530293424251332243032379.514.012.021.07.59.52.017.57.514.017.524.04433228473140303335182135282226.019.55.51.027.016.025.014.019.522.53.04.022.511.05.5原始數(shù)據(jù)秩259.54426.032非參數(shù)檢驗過程1.不涉及總體的分布Example:ProbabilityDistributions,Independence2.數(shù)據(jù)的形態(tài)各異定量數(shù)據(jù)定序數(shù)據(jù)Example:Good-Better-Best名義數(shù)據(jù)Example:Male-Female3.例子:WilcoxonRankSumTest/RunTestF,F,F,F,F,F,F,F,M,M,M,M,M,M,MF,M,F,M,F,M,F,M,F,M,F,M,F,M,F非參數(shù)檢驗過程1.不涉及總體的分布F,F,F,F,F33參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計的比較問題:一種統(tǒng)計方法是否比其它方法更好,通常要從幾個方面來考慮。有效性或效率(efficiency)。在其他條件相同情況下,一種方法需要的樣本容量越小,則效率越高,通常用二者的樣本容量比值來度量相對效率。在假設檢驗中,樣本均值是檢驗總體均值的一個好的檢驗統(tǒng)計量,它對總體均值的不同十分敏感,但是的分布取決于總體的分布,而這通常是未知的。參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計的比較問題:34穩(wěn)健性(robust)。如果一種方法背后的某個假設條件不成立,但它還是近似有效的,則可認為這一方法對這一條件是穩(wěn)健的。通常來說,穩(wěn)健是指基于正態(tài)假設的方法(即使?jié)撛诘目傮w分布是非正態(tài)的)檢驗統(tǒng)計量也有近似相同的零分布。比如單樣本的t檢驗,當樣本容量很大時,對于正態(tài)假設是穩(wěn)健的。沒有一個總體是精確的服從正態(tài)分布或其他已知分布,如果總體是近似正態(tài)分布的,那么基于正態(tài)分布來進行推斷是安全的,反之,我們就要考慮非參數(shù)方法。穩(wěn)健性(robust)。如果一種方法背后的某個假設條件不成立35t檢驗這一方法是穩(wěn)健的,當總體是非正態(tài)分布時,它是否象正態(tài)分布一樣有效?一種方法固然應該是穩(wěn)健的,更應該是有效的。相合性或漸進性(consistent),多數(shù)參數(shù)檢驗對于非正態(tài)分布條件是穩(wěn)健的,相合的,即隨著樣本容量的增加,方法將更為穩(wěn)健,對于無限樣本而言,方法是精確的且不依賴于總體分布。t檢驗這一方法是穩(wěn)健的,當總體是非正態(tài)分布時,它是否象正態(tài)分36對總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。1.假定較少2.不需要對總體參數(shù)的假定3.與參數(shù)結(jié)果接近針對幾乎所有類型的數(shù)據(jù)形態(tài)。容易計算在計算機盛行之前就已經(jīng)發(fā)展起來。非參數(shù)檢驗的優(yōu)點對總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。非參數(shù)檢驗的371. 可能會浪費一些信息特別當數(shù)據(jù)可以使用參數(shù)模型的時候。2. 大樣本手算相當麻煩3. 一些表不易得到非參數(shù)檢驗的弱點因此我們實際上給出了一個沒有實際意義的結(jié)果:沒有一種方法是萬能的。1. 可能會浪費一些信息非參數(shù)檢驗的弱點因此我們實際上給出了38本學期內(nèi)容結(jié)構體系本學期內(nèi)容結(jié)構體系39非參數(shù)統(tǒng)計的主要內(nèi)容內(nèi)容非參數(shù)檢驗相應的參數(shù)檢驗獨立樣本中位數(shù)檢驗秩和檢驗獨立樣本t檢驗2配對樣本/單一樣本符號檢驗Wilcoxon檢驗成對樣本t-檢驗>2獨立樣本Kruskal-Wallis檢驗單一因素ANOVA兩因素Friedman檢驗雙因素ANOVA相關性檢驗Spearman秩相關Pearson相關性檢驗分布的檢驗Kolmogorov-Smirnov非參數(shù)統(tǒng)計的主要內(nèi)容內(nèi)容非參數(shù)檢驗相應的參數(shù)檢驗獨立樣本中位40§1.2順序統(tǒng)計量,秩和線性秩統(tǒng)計量
一、順序統(tǒng)計量因為非參數(shù)方法通常并不假定總體分布。因此,觀測值的順序及性質(zhì)則作為研究的對象。順序統(tǒng)計量:對于樣本X1,X2,X3,…,Xn,如果按照升冪排列,得到稱為第k個順序統(tǒng)計量?!?.2順序統(tǒng)計量,秩和線性秩統(tǒng)計量一、順序統(tǒng)計量稱412、基于順序統(tǒng)計量的統(tǒng)計量中位數(shù)極差3、順序統(tǒng)計量分布函數(shù)設總體的分布函數(shù)F(X),則第r個順序統(tǒng)計量的分布函數(shù)為2、基于順序統(tǒng)計量的統(tǒng)計量中位數(shù)極差3、順序統(tǒng)計量分布函數(shù)42(4)順序統(tǒng)計量密度函數(shù)(如果分布密度存在)(4)順序統(tǒng)計量密度函數(shù)(如果分布密度存在)43同樣我們可以得到順序統(tǒng)計量X(r)和X(s)的聯(lián)合密度函數(shù)為:特別地,極差的分布函數(shù)為:同樣我們可以得到順序統(tǒng)計量X(r)和X(s)的聯(lián)合密度函數(shù)44分位數(shù)對于離散數(shù)據(jù),給定n個值X1,…,Xn,則p分位數(shù)定義為為:定義(連續(xù)分布)分位數(shù)對于離散數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度綠色環(huán)保廁所技術創(chuàng)新合同范本
- 二零二五年度幼兒園后勤服務承包合同
- 2025版洞渣運輸工程招投標合同
- 2025年物流園區(qū)PPP項目特許經(jīng)營服務協(xié)議
- 二零二五年店面租賃轉(zhuǎn)售合同范本解讀
- 2025版夫妻共同財產(chǎn)分割及遺產(chǎn)繼承協(xié)議
- 2025版臨時工勞動協(xié)議書(互聯(lián)網(wǎng)行業(yè)適用)
- 2025版裝配式建筑包工頭勞務承包合同模板
- 二零二五年度環(huán)保型工程截樁施工合同
- 2025房地產(chǎn)公司銷售員獨家代理權聘用合同
- 2025年度四川達州電力集團有限公司員工招聘筆試參考題庫附帶答案詳解
- 貴金屬提煉過程中的貴金屬礦床考核試卷
- 車輛租賃交接協(xié)議書范本
- 蘿卜種植協(xié)議書范本
- 2025-2030中國浮選設備行業(yè)供需格局及發(fā)展趨勢前景分析研究報告
- 廣東高考英語聽說評分標準
- 預防接種警示教育案例
- 高處作業(yè)吊籃運用管理手冊
- 2025至2030年中國大型煙花數(shù)據(jù)監(jiān)測研究報告
- 2024年秋新粵滬版八年級上冊物理全冊教學課件(新版教材)
- 2025年機關事業(yè)單位工人招聘《機動車駕駛員》技師 考試題庫與參考答案
評論
0/150
提交評論