《非參數(shù)統(tǒng)計》課件第5章 非參數(shù)相關(guān)性度量_第1頁
《非參數(shù)統(tǒng)計》課件第5章 非參數(shù)相關(guān)性度量_第2頁
《非參數(shù)統(tǒng)計》課件第5章 非參數(shù)相關(guān)性度量_第3頁
《非參數(shù)統(tǒng)計》課件第5章 非參數(shù)相關(guān)性度量_第4頁
《非參數(shù)統(tǒng)計》課件第5章 非參數(shù)相關(guān)性度量_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第5章非參數(shù)相關(guān)性度量本章內(nèi)容:5.1斯皮爾曼(Spearman)秩相關(guān)5.2肯德爾(Kendall)秩相關(guān)5.3霍夫?。℉oeffding)獨立性檢驗5.1斯皮爾曼(Spearman)秩相關(guān)秩相關(guān)(RankCorrelation)也稱作級序相關(guān)或等級相關(guān),用于兩個至少是定序尺度測量的樣本間相關(guān)程度的測定。1.基本方法

X和Y的評秩完全相同(完全正相關(guān))X和Y的評秩完全相反(完全負(fù)相關(guān))X的秩Y的秩X的秩Y的秩111n222n-1n-1n-1n-12nnn1

上面的式子取值在0到1之間。當(dāng)X和Y完全正相關(guān)時,取值為0;當(dāng)X和Y完全負(fù)相關(guān)時,取值為1。當(dāng)數(shù)據(jù)沒有同分時,為了與皮爾遜相關(guān)相統(tǒng)一,定義斯皮爾曼秩相關(guān)系數(shù)為

這樣定義可以讓R的取值從-1到+1。其中,|R|=1表明X和Y完全相關(guān),R=+1為完全正相關(guān),R=-1為完全負(fù)相關(guān)。|R|越接近于1,表明相關(guān)程度越高。反之,|R|越接近于零,表明相關(guān)程度越低,R=0為完全不相關(guān)。通過一些代數(shù)運算,可以得到

這說明,斯皮爾曼秩相關(guān)系數(shù)本質(zhì)是用秩替換原始數(shù)據(jù)的皮爾遜相關(guān)系數(shù)。

2.應(yīng)用【例5.1】2位教授對本科畢業(yè)設(shè)計評分的相關(guān)分析。數(shù)據(jù)如下表:畢業(yè)生編號A教授B教授115223359496548664732871910710810分析:由于例5.1給出的數(shù)據(jù)為評分等級,兩個定序數(shù)據(jù)間的相關(guān)程度測定可以采用斯皮爾曼秩相關(guān)系數(shù)。利用R語言的函數(shù)cor可直接算出需要的數(shù)值。結(jié)果表明R=0.3212<0.8,兩位教授對10名本科生畢業(yè)設(shè)計評分的相關(guān)程度不高。注:斯皮爾曼秩相關(guān)系數(shù)不僅可以直接用等級來進(jìn)行計算,也可以將高于定序尺度測量的數(shù)據(jù)轉(zhuǎn)換為秩次進(jìn)行計算。其使用范圍比皮爾遜相關(guān)系數(shù)廣?!纠?.2】經(jīng)濟發(fā)展水平和衛(wèi)生水平之間的相關(guān)分析。

對某地區(qū)12個街道進(jìn)行調(diào)查,并對經(jīng)濟發(fā)展水平和衛(wèi)生水平按規(guī)定的標(biāo)準(zhǔn)打分,并按從小到大的順序排等級,得到評分的秩,評定結(jié)果如下表。街道編號經(jīng)濟水平及秩衛(wèi)生水平及秩街道編號經(jīng)濟水平及秩衛(wèi)生水平及秩182686978478072879786878477536016529805764498128810109411961257536411185885868910901112682703結(jié)果表明,R=0.888>0.8,該地區(qū)的經(jīng)濟發(fā)展水平和衛(wèi)生水平存在著正相關(guān),相關(guān)程度較高,為88.8%。3.同分的處理

公式中,u是X中同分的觀測值數(shù)目,v是Y中同分的觀測值數(shù)目?!纠?.3】經(jīng)濟發(fā)展水平和衛(wèi)生水平間的相關(guān)分析某地區(qū)對24個地區(qū)進(jìn)行調(diào)查,并對各地區(qū)的經(jīng)濟發(fā)展水平和衛(wèi)生水平按規(guī)定標(biāo)準(zhǔn)評分,結(jié)果如下表。地區(qū)編號經(jīng)濟水平衛(wèi)生水平地區(qū)編號經(jīng)濟水平衛(wèi)生水平192561368552907014676639071156559487761664585816917615068068186054779621959438777020554597664214634107663224232117454233930126865243831利用R語言的函數(shù)輸出結(jié)果表明,R=0.8490>0.8,說明經(jīng)濟水平和衛(wèi)生水平之間存在較高的相關(guān)性。如果不對同分進(jìn)行修正,強行利用不修正的公式計算斯皮爾曼秩相關(guān)系數(shù)為0.8491。數(shù)值上與修正結(jié)果有細(xì)微差別,但也是大于0.8的。對比兩個R值可知,由于同分的觀測值數(shù)目占觀測值總數(shù)目的比例不是很大,因而校正后的R與校正前的R變化不大。校正前的R略大于校正后的R,這說明同分對R的影響雖然很小,但同分的影響是夸大R值。因此,在X與Y中至少有一個存在大量同分時,應(yīng)進(jìn)行校正。4.斯皮爾曼秩相關(guān)的顯著性檢驗對兩個樣本X和Y計算斯皮爾曼秩相關(guān)系數(shù)之后,可以根據(jù)相關(guān)系數(shù)的大小,推斷總體秩相關(guān)的方向,并用顯著性檢驗進(jìn)行回答。針對研究問題的不同,可以建立不同的假設(shè)組:

為對假設(shè)作出判定,所需數(shù)據(jù)至少是定序尺度測量的。檢驗統(tǒng)計量就是斯皮爾曼秩相關(guān)的公式(有同分時用修正公式),p值為相應(yīng)情況的尾部概率。當(dāng)原假設(shè)為真且樣本量比較大時

備擇假設(shè)精確p值正態(tài)近似p值R的右尾概率Z的右尾概率R的左尾概率Z的左尾概率R的小尾概率的2倍Z的小尾概率的2倍【例5.4】對例5.3作顯著性檢驗。

5.2肯德爾(Kendall)秩相關(guān)肯德爾秩相關(guān)與斯皮爾曼秩相關(guān)一樣,也是用于兩個樣本相關(guān)程度的測量,要求數(shù)據(jù)至少是定序尺度的。它也是利用兩組秩次測定兩個樣本間相關(guān)程度的一種非參數(shù)統(tǒng)計方法。1.基本方法

例如,X、Y的秩分別為X:2,4,3,5,1;Y:3,4,1,5,2。將X的秩按從小到大順序排列后,則X和Y的秩則為下面的形式:X:1,2,3,4,5;Y:2,3,1,4,5。稱秩的大小方向一致的對為協(xié)同(concordant)對或一致對。由于X的秩次已經(jīng)按自然順序由小到大排列,因此,X的觀測值每兩個之間都是一致對??疾靁的秩次情況,第一個秩為2,第二個為3,因為2小于3,是按自然順序增加,因此,這是一個一致對。再考察2和1,因為2大于1,不是按自然順序增加排列,所以這是一個非一致對。依次考察下去,凡一致對記為+1分,非一致對記為-1分。Y的數(shù)對分?jǐn)?shù)總和2,318個+2個-2,1-12,412,513,1-13,413,511,411,514,51

若以U表示Y的一致對數(shù)目,V表示Y的非一致對數(shù)目,則一致對評分與最大可能總評分之比為

當(dāng)X和Y的順序完全一致時,上式的值為1;當(dāng)兩者順序完全相反時,上式值為0;當(dāng)X和Y之間的順序關(guān)系不確定時,該式取值在0和1之間。顯然,X和Y的這種順序關(guān)系反映出兩個總體之間的某種關(guān)聯(lián)性??系聽栔认嚓P(guān)系數(shù)定義為

當(dāng)X和Y的順序關(guān)系完全一致時,T為1;順序關(guān)系完全相反時,T為-1。注意到

2.應(yīng)用【例5.6】利用例5.2的數(shù)據(jù)資料分析經(jīng)濟水平和衛(wèi)生水平的相關(guān)程度。

注:由于肯德爾秩相關(guān)系數(shù)是利用兩總體的順序關(guān)系定義的相關(guān)關(guān)系,對于定距尺度測量的數(shù)據(jù),數(shù)據(jù)不必評秩,而直接比較大小得到一致對或非一致對的數(shù)目,就可以計算相關(guān)系數(shù)的值。3.同分的處理當(dāng)兩個樣本中無論哪一個或者兩個均有同分觀察值時,仍采用通常的辦法,將每一個同分觀察值的秩記作其應(yīng)有秩的平均值。由于同分的影響,也需要對T計算公式中的分母進(jìn)行校正。在同分情況下,肯德爾秩相關(guān)系數(shù)公式修正為

【例5.7】兩位專家對5件參賽作品評秩的相關(guān)分析。兩位專家對5件參賽作品所評的等級如下:X的秩:1,2.5,2.5,4.5,4.5;Y的秩:2,3.5,3.5,1,5。分析:由于X、Y中均有同秩,因此X的秩按自然順序排列時,同秩的兩個值可能對應(yīng)Y的不同秩。用R語言中的cor函數(shù)可對同分情形自動修正,得到修正后的T值。

設(shè)X和Y是兩個待研究的總體,如果研究關(guān)心的是相關(guān)是否確實存在,而不考慮相關(guān)的方向,進(jìn)行雙側(cè)檢驗,假設(shè)組為

為對假設(shè)作出判定,所需數(shù)據(jù)至少是定序尺度測量的。檢驗統(tǒng)計量為肯德爾秩相關(guān)系數(shù)公式T,如有同分應(yīng)選擇修正的公式T。當(dāng)樣本量足夠大時,有

備擇假設(shè)精確p值正態(tài)近似p值T的右尾概率Z的右尾概率T的左尾概率Z的左尾概率T的小尾概率的2倍Z的小尾概率的2倍【例5.8】雙胞胎智力的相關(guān)分析,某研究所對10對雙胞胎兒童的智力進(jìn)行凋查,結(jié)果如下表。雙胞胎編號先出生兒童智力(X)后出生兒童智力(Y)197.8216.619.3316.220.1411.37.1516.21367.14.877.88.9847.4911.210101.31.5分析:智力測試得分是定距尺度測量的數(shù)據(jù),可以轉(zhuǎn)換為定序尺度,以X記為先出生兒童的智力,以Y記為后出生兒童的智力。本例可采用斯皮爾曼秩相關(guān)(R)顯著性檢驗和肯德爾秩相關(guān)(T)顯著性檢驗。斯皮爾曼秩相關(guān)顯著性檢驗的R語言命令前面已經(jīng)講過,肯德爾秩相關(guān)顯著性檢驗的命令同樣是cor.test,只是參數(shù)設(shè)置不同。

5.斯皮爾曼秩相關(guān)系數(shù)和肯德爾秩相關(guān)系數(shù)的比較

5.3霍夫?。℉oeffding)獨立性檢驗霍夫丁獨立性檢驗是1948年提出的方法,用于檢驗兩個隨機變量的獨立性。其思想不同于斯皮爾曼秩相關(guān)和肯德爾秩相關(guān)。1.基本方法

霍夫?。℉oeffding)獨立性檢驗的假設(shè)組為

這個D就是檢驗統(tǒng)計量,在原假設(shè)成立時,D的取值應(yīng)該傾向小,如果D的值過大,就要懷疑原假設(shè)不真?;舴蚨—毩⑿詸z驗的p值可以通過D的右尾概率計算。當(dāng)數(shù)據(jù)有同分時,只要同分的比例不大,對估計的結(jié)果影響不大。2.應(yīng)用【例5.9】利用例5.8的數(shù)據(jù)資料檢驗雙胞胎智力的獨立性。

計算統(tǒng)計量D的右尾概率。在R語言中,有程序包Hmisc中的hoeffd函數(shù)可以計算霍夫丁獨立性檢驗的統(tǒng)計量D值以及檢驗的漸近p值,如果要求精確p值,R程序包NSM3中的pHoeff函數(shù)可以用蒙特卡洛方法得到p值。結(jié)果表明,D值是0.28,漸近p值是0.0016,拒絕原假設(shè),前后出生的雙胞胎智力不獨立。理論上可以證明,D值是在0到1/30之間,在實際應(yīng)用中為使D值在0到1之間變化,通常報告30D的值,R語言的hoeffd函數(shù)也是如此。D值越大,兩個隨機變量就越不獨立。但是不能在數(shù)值上與其他方法相比?!纠?.10】檢驗隨機變量之間的非線性關(guān)系。

結(jié)果匯總到下表:方法皮爾遜斯皮爾曼肯德爾霍夫丁平均p值0.4530.4230.382標(biāo)準(zhǔn)差0.311

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論