




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六章相關(guān)分析一、相關(guān)分析的概念相關(guān)分析是研究變量間密切程度的一種常用統(tǒng)計(jì)方法。線性相關(guān)分析研究?jī)蓚€(gè)變量間線性關(guān)系的程度。相關(guān)系數(shù)是描述這種線性關(guān)系程度和方向的統(tǒng)計(jì)量,通常用r表示。相關(guān)系數(shù)r沒有單位;其值在-1~+1之間。當(dāng)數(shù)值愈接近-l或+1之間時(shí),關(guān)系愈緊密,接近于0時(shí),關(guān)系愈不緊密。對(duì)其數(shù)值可以從小到大排列的數(shù)據(jù)才能計(jì)算其相關(guān)系數(shù)。例如不能計(jì)算宗教信仰與顏色喜好之間的關(guān)系。
二、相關(guān)系數(shù)積矩相關(guān)系數(shù)(Pearson相關(guān)系數(shù))Spearman和Kendall秩相關(guān)系數(shù)偏相關(guān)系數(shù)1、積矩相關(guān)系數(shù)(Pearson相關(guān)系數(shù))積矩相關(guān)系數(shù)(又稱積差相關(guān)系數(shù))適用于等間隔測(cè)度,相關(guān)系數(shù)采用Pearson積矩相關(guān)。2、Spearman和Kendall秩相關(guān)系數(shù)
Spearman和Kendall秩相關(guān)系數(shù)是一種非參測(cè)度,是根據(jù)秩而不是根據(jù)實(shí)際值計(jì)算的秩相關(guān)適用于下列資料不服從雙變量正態(tài)分布;總體分布型未知;用等級(jí)表示的資料。Spearman和Kendall秩相關(guān)系數(shù)Spearman相關(guān)系數(shù)是Pearson相關(guān)系數(shù)的非參形式。是根據(jù)數(shù)據(jù)的秩而不是根據(jù)實(shí)際值計(jì)算的。也就是說,先對(duì)原始變量的數(shù)據(jù)排秩,根據(jù)各秩使用相關(guān)系數(shù)公式進(jìn)行計(jì)算。它適合有序數(shù)據(jù)或不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù)。相關(guān)系數(shù)的值范圍也是在-1~+1之間。絕對(duì)值越大表明相關(guān)越強(qiáng)。相關(guān)系數(shù)的符號(hào)也表示相關(guān)的方向。這兩種相關(guān)系數(shù)的計(jì)算必須對(duì)連續(xù)變量值排秩,對(duì)離散變量排序。Spearman和Kendall秩相關(guān)系數(shù)例如,我們可以將一組學(xué)生按入學(xué)考試成績(jī)和第一學(xué)年結(jié)業(yè)成績(jī)的順序排隊(duì)。如果將入學(xué)考試成績(jī)的評(píng)秩記為X1,X2,Xn,而學(xué)年結(jié)業(yè)成績(jī)的評(píng)秩記為Y1,Y2,Yn,我們就可以用秩相關(guān)度量來決定X和Y之間的相關(guān)性。Ri為第i個(gè)X值的秩,Si為第i個(gè)Y值的秩。Spearman和Kendall秩相關(guān)系數(shù)Kendall‘stau-b也是一種對(duì)兩個(gè)有序變量或兩個(gè)秩變量間的關(guān)系程度的測(cè)度,因此也屬于一種非參測(cè)度。以一個(gè)例子來進(jìn)行Kendall秩相關(guān)系數(shù)的計(jì)算。如果兩位鑒定家各自以吸引力的大小將7幅抽象派畫評(píng)定了秩,那么可能知道這些秩評(píng)定之間的相符的程度。依次取觀測(cè)2(鑒別家2)給出的秩,數(shù)出每一個(gè)右面在秩次上比自己小的個(gè)數(shù),并將這些個(gè)數(shù)加起來。例如抽象畫2的秩為2,其個(gè)數(shù)是1,因?yàn)槠溆疫叺闹挥谐橄螽?的秩比它小。6個(gè)數(shù)依次為1,1,0,0,1和0,所以總和為Q=3,Kendall秩相關(guān)系數(shù)則為:
R=1-4Q/n(n-1)=1-12/42=0.714
畫號(hào)2651437鑒別家11234567鑒別家223146573、偏相關(guān)系數(shù)偏相關(guān)系數(shù)描述的是當(dāng)控制了一個(gè)或幾個(gè)另外的變量的影響條件下兩個(gè)變量間的相關(guān)性。例如:可以控制年齡和工作經(jīng)驗(yàn)兩個(gè)變量的影響,估計(jì)工資收入與受教育程度之間的相關(guān)關(guān)系??刂屏俗兞縕,變量X與Y之間的偏相關(guān),和控制了兩個(gè)變量Z1、Z2,變量X與Y之間的偏相關(guān)系數(shù)計(jì)算公式不同。相似性與不相似性
兩個(gè)或若干變量之間或兩組觀測(cè)量之間的關(guān)系有時(shí)也可以用相似性或不相似性來描述。相似性測(cè)度用大數(shù)值表示很相似,較小的數(shù)值表明相似性小。不相似性使用距離或不相似性來描述。大值表示相差甚遠(yuǎn)。三、相關(guān)系數(shù)統(tǒng)計(jì)意義的檢驗(yàn)四、相關(guān)分析的SPSS過程Bivarate(相關(guān)分析)命令項(xiàng)調(diào)用Correlations過程,按指定項(xiàng)顯示變量的描述統(tǒng)計(jì)量。計(jì)算指定的兩個(gè)變量間的相關(guān)系數(shù),可以選擇Pearson相關(guān)、Spearman和Kendall'stau-b
相關(guān);同時(shí)對(duì)相關(guān)系數(shù)進(jìn)行檢驗(yàn)。檢驗(yàn)的零假設(shè)是:相關(guān)系數(shù)為0??梢詫?duì)檢驗(yàn)進(jìn)行單尾或雙尾的選擇。給出相關(guān)系數(shù)為0的概率。
Partial(偏相關(guān)分析)命令項(xiàng)調(diào)用PartialCorr過程,計(jì)算兩個(gè)變量間在控制了其他變量的影響下的相關(guān)系數(shù)??梢赃x擇單尾或雙尾顯著性檢驗(yàn)。檢驗(yàn)的零假設(shè)是:偏相關(guān)系數(shù)為零。還可以要求計(jì)算其他描述統(tǒng)計(jì)量。相關(guān)分析的SPSS過程Distance(距離分析)命令項(xiàng)調(diào)用Proximities過程,對(duì)變量或觀測(cè)量進(jìn)行相似性或不相似性測(cè)度。因此分析的變量可以是連續(xù)變量、表示頻數(shù)分布的變量,某些測(cè)度還可以適用于二值變量??梢詫?duì)原始數(shù)據(jù)和計(jì)算出的距離數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。相關(guān)分析的SPSS過程說明如果需要確定兩個(gè)變量或若干自變量與因變量具體的函數(shù)關(guān)系,使用相關(guān)分析不能達(dá)到目的,必須使用回歸分析。如果要將觀測(cè)量或變量歸到確定的類中,必須使用聚類分析中的觀測(cè)量聚類或變量聚類的相應(yīng)過程。(一)兩個(gè)變量間的相關(guān)分析
本節(jié)介紹兩變量間的相關(guān)。包括兩個(gè)連續(xù)變量間的相關(guān)和兩個(gè)等級(jí)變量間的秩相關(guān)。這兩種相關(guān)使用同一個(gè)命令項(xiàng)Bivarate調(diào)用,通過選擇不同的分析方法調(diào)用不同的分析過程。選擇哪一種分析方法要看具體的數(shù)據(jù)類型。對(duì)于連續(xù)變量和等級(jí)變量選擇不同的分析方法。兩個(gè)變量間的相關(guān)分析Pearson調(diào)用correlation過程計(jì)算連續(xù)變量或等間隔測(cè)量的變量間的相關(guān)系數(shù)。Kendall'stau-b調(diào)用Nonpar
corr過程計(jì)算分類變量間的秩相關(guān)。Spearman調(diào)用Nonpar
corr過程計(jì)算斯皮爾曼秩相關(guān)。如果參與分析的變量是連續(xù)變量,選擇Kendall'stau-b或Spearman相關(guān),則系統(tǒng)自動(dòng)對(duì)連續(xù)變量的值先求秩,再計(jì)算其秩分?jǐn)?shù)間的相關(guān)系數(shù)。使用系統(tǒng)默認(rèn)值進(jìn)行相關(guān)分析
l962~1988年安徽省國(guó)民收入與城鄉(xiāng)居民儲(chǔ)蓄存款余額兩個(gè)變量間的相關(guān)分析為例,說明使用系統(tǒng)默認(rèn)值進(jìn)行連續(xù)變量相關(guān)分析的方法。數(shù)據(jù)編號(hào)data10-01。
變量包括:income國(guó)民收入(億元),deposit城鄉(xiāng)居民儲(chǔ)蓄存款余額,number序號(hào),year年份。例一Data09-03是銀行雇員數(shù)據(jù),要求分析起始工資、當(dāng)前工資、與雇員年齡、受教育水平、工作經(jīng)驗(yàn)職務(wù)等之間是否存在線性關(guān)系。例二10名學(xué)生兩科課程的名次排列,要求求出其等級(jí)相關(guān)系數(shù),檢驗(yàn)其顯著性。Data10-03練習(xí)題某婦幼保健醫(yī)院對(duì)33名產(chǎn)婦進(jìn)行產(chǎn)前檢查并得到嬰兒體重的原始觀測(cè)值包括髂前上棘間徑(x1),髂脊間徑(x2),恥骶外徑(x3),坐骨間徑(x4),血紅蛋白(x5),嬰兒體重(X6)等6個(gè)指標(biāo)。試分析各指標(biāo)的相關(guān)系數(shù)。Hong1.sav練習(xí)題從下表所給資料分析血小板和出血癥的關(guān)系。試分析上述資料有無相關(guān)關(guān)系。病例號(hào)123456789101112血小板數(shù)12013016031042054074010601260123014402000出血癥狀++++++--++----++-Spearman.sav(二)偏相關(guān)分析相關(guān)分析計(jì)算兩個(gè)變量間的相關(guān)系數(shù),分析兩個(gè)變量間線性關(guān)系的程度。往往因?yàn)榈谌齻€(gè)變量的作用,使相關(guān)系數(shù)不能真正反映兩個(gè)變量間線性程度。偏相關(guān)分析例如身高、體重與肺活量之間的關(guān)系。使用Pearson相關(guān)計(jì)算其相關(guān)系數(shù),可以得出肺活量與身高和體重均存在較強(qiáng)的線性關(guān)系。但實(shí)際上,如果對(duì)體重相同的人,分析身高和肺活量。是否身高值越大,肺活量越大呢?結(jié)論是否定的。正是因?yàn)樯砀吲c體重有著線性關(guān)系,體重與肺活量存在線性關(guān)系,因此,得出身高與肺活量之間存在較強(qiáng)的線性關(guān)系的錯(cuò)誤結(jié)論。偏相關(guān)分析的任務(wù)就是在研究?jī)蓚€(gè)變量之間的線性相關(guān)關(guān)系時(shí)控制可能對(duì)其產(chǎn)生影響的變量。例一分析身高、體重、肺活量間的關(guān)系數(shù)據(jù)編號(hào)data10-04分別調(diào)用bivariate和partial過程,比較其結(jié)例二四川綿陽地區(qū)3年生中山柏的數(shù)據(jù)。分析月生長(zhǎng)量與月平均氣溫、月降雨量、月平均日照時(shí)數(shù)、月平均濕度四個(gè)氣候因素哪個(gè)因素有關(guān)。Month:月份,hgrow:生長(zhǎng)量,temp:月平均氣溫,rain:月降雨量,hsun:月平均日照時(shí)數(shù),humi:月平均濕度。數(shù)據(jù)編號(hào)data10-05分析變量:hgrow(生長(zhǎng)量)與hsun(月平均日照時(shí)數(shù))控制變量:humi(月平均濕度)、rain(月降雨量)、temp(月平均氣溫)練習(xí)題289名肝炎患者的檢測(cè)結(jié)果見數(shù)據(jù)文件“patial_corr.sav",5個(gè)變量分別為:“group'’(肝硬化分類)、“ha'’(透明質(zhì)酸)、“l(fā)n”(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年廣東華潤(rùn)電力春季招聘考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解一套
- 2025福建福州市長(zhǎng)樂區(qū)衛(wèi)健系統(tǒng)招聘78人模擬試卷及答案詳解1套
- 2025年哈爾濱巴彥縣公安局公開招聘警務(wù)輔助人員32人模擬試卷附答案詳解(突破訓(xùn)練)
- 2025廣東東莞市東坑鎮(zhèn)中心幼兒園第二批招聘老師3人考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解(各地真題)
- 2025廣東南粵銀行資金運(yùn)營(yíng)中心招聘模擬試卷(含答案詳解)
- 2025年春季福建華南女子職業(yè)學(xué)院人才招聘15人考前自測(cè)高頻考點(diǎn)模擬試題有完整答案詳解
- 2025年中國(guó)化妝品級(jí)2-甲基間苯二酚行業(yè)市場(chǎng)分析及投資價(jià)值評(píng)估前景預(yù)測(cè)報(bào)告
- 2025北京市衛(wèi)生健康委員會(huì)直屬事業(yè)單位招聘20人考前自測(cè)高頻考點(diǎn)模擬試題(含答案詳解)
- 2025年大慶薩爾圖區(qū)開展“職引未來全國(guó)城市聯(lián)合招聘高校畢業(yè)生春季專場(chǎng)活動(dòng)”模擬試卷附答案詳解(突破訓(xùn)練)
- 2025年5月漢中市鐵路中心醫(yī)院招聘模擬試卷及答案詳解(網(wǎng)校專用)
- 2025-2026學(xué)年高一上學(xué)期第一次月考物理試卷(北京)
- 第一單元《精神信仰力量情感》《大路歌》教學(xué)設(shè)計(jì)湘藝版初中音樂八年級(jí)上冊(cè)
- 動(dòng)火作業(yè)現(xiàn)場(chǎng)安全防護(hù)設(shè)施布置與維護(hù)更新方案
- 核心素養(yǎng)導(dǎo)向課堂教學(xué)反思
- 《機(jī)器學(xué)習(xí)》課件-第3章 監(jiān)督學(xué)習(xí)
- 山東省濟(jì)南市2025屆中考數(shù)學(xué)真題(含答案)
- 醫(yī)療機(jī)構(gòu)醫(yī)療質(zhì)量安全專項(xiàng)整治行動(dòng)方案
- 基于SprintBoot的大學(xué)生實(shí)習(xí)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
- 外踝撕脫骨折課件
- 鋼架油漆翻新施工方案(3篇)
- 數(shù)字平臺(tái)治理 課件 第五章 數(shù)字平臺(tái)生態(tài)治理
評(píng)論
0/150
提交評(píng)論