




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第七講相關分析——雙變量關系之描述一、基本概念與原理變量之間的關系:函數(shù)關系和統(tǒng)計關系
比如,家庭收入和支出、一個人所受教育程度與其收入、子女身高和父母身高等,…一、基本概念與原理相關分析:衡量事物之間或稱變量之間線性相關程度的強弱,并用適當?shù)慕y(tǒng)計指標表示出來的過程。相關系數(shù):衡量變量之間相關程度的一個量值。相關關系正相關、負相關與零相關強相關、中度相關與弱相關線性相關與非線性相關相關系數(shù)相關系數(shù)r的數(shù)值范圍是在一1到十1之間。相關系數(shù)r的正負號表示變化方向?!?”號表示變化方向一致,即正相關;“-”號表示變化方向相反,即負相關。r的絕對值表示變量之間的密切程度(即強度)。絕對值越接近1,表示兩個變量之間關系越密切;越接近0,表示兩個變量之間關系越不密切。相關系數(shù)相關系數(shù)的值,僅僅是一個比值。它不是由相等單位度量而來(即不等距),也不是百分比,因此,不能直接作加、減、乘、除運算。相關系數(shù)只能描述兩個變量之間的變化方向及密切程度,并不能揭示兩者之間的內在本質聯(lián)系,即存在相關的兩個變量,不一定存在因果關系。散點圖基本原理(以積差相關為例)若>0,則x與y之間為正相關;若<0,則x與y之間為負相關;若→0,則x與y之間無相關關系。
二、相關分析方法連續(xù)變量的相關分析等級變量的相關分析質量相關分析品質相關分析偏相關分析距離相關分析連續(xù)變量的相關分析連續(xù)變量即數(shù)據(jù)變量,它的取值之間可以比較大小,可以用加減法計算出差異的大小。如“年齡”、“收入”、“成績”等變量。當兩個變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關系時,表示這兩個變量之間的相關稱為積差相關。通常用Pearson相關系數(shù)來衡量。連續(xù)變量的相關分析Pearson相關系數(shù)的計算公式積差相關的使用條件兩個變量都是由測量獲得的連續(xù)性數(shù)據(jù);兩個變量的總體都是呈正態(tài)分布,或接近正態(tài)分布,至少是單峰的對稱分布。必須是成對數(shù)據(jù),而且每對數(shù)據(jù)之間必須是相互獨立。兩個變量之間呈線性關系。要排除共變因素的影響。樣本容量要大于等于30,計算出的積差相關系數(shù)才具有有效意義。積差相關系數(shù)的顯著性檢驗ρ=0統(tǒng)計假設H0:ρ=0;H1:ρ≠0統(tǒng)計量T統(tǒng)計量服從n-2個自由度的t分布。積差相關系數(shù)的顯著性檢驗ρ≠0ρ≠0時r的樣本分布不是正態(tài),這時需要將r與ρ都轉換成費舍。的分布可以認為是正態(tài),其平均數(shù),標準誤這樣就可以進行Z檢驗了。統(tǒng)計量如表所示,10個學生初一數(shù)學分數(shù)與初二數(shù)學分數(shù)的相關系數(shù)為0.87,問從總體上來說,初一與初二數(shù)學分數(shù)是否存在相關?序號12345678910總和X74717268767367706574710Y76757170767965776272723檢驗的步驟提出假設計算檢驗統(tǒng)計量統(tǒng)計決斷所以,從總體上說,初一數(shù)學分數(shù)與初二數(shù)學分數(shù)存在正相關。例如:29個學生幾何期中與期末考試成績的相關系數(shù)r=0.30,問全年級幾何期中與期末考試成績的相關系數(shù)是否為0.64?提出假設等距轉換選擇檢驗統(tǒng)計量并計算其值統(tǒng)計決斷即全年級幾何期中與期末考試成績之間的相關系數(shù)極少可能是0.64。等級變量的相關分析是指以等級次序排列或以等級次序表示的變量之間的相關。當測量得到的數(shù)據(jù)不是等距或等比數(shù)據(jù),而是具有等級順序的數(shù)據(jù);或者得到的數(shù)據(jù)是等距或等比數(shù)據(jù),但其所來自的總體分布不是正態(tài)的,不滿足求積差相關的要求。這時就要運用等級相關系數(shù)。它主要包括斯皮爾曼(spearman)二列等級相關及肯德爾和諧系數(shù)多列等級相關.斯皮爾曼二列等級相關當兩個變量值以等級次序排列或以等級次序表示時,兩個相應總體并不一定呈正態(tài)分布,樣本容量也不一定大于30,表示這兩變量之間的相關,稱為Spearman等級相關。例:10名高三學生學習潛在能力測驗與自學能力測驗成績如下表所示,問兩者相關情況如何?學生序號學習潛在能力自學能力等級差數(shù)差數(shù)平方X等級Y等級123456789109084767171716968666412355578910325786871092135.57.547.55.5109-110-0.5-2.51-0.52.5-111100.256.2510.256.2511總和18等級相關系數(shù)的顯著性檢驗與積差相關系數(shù)檢驗的方法相同10個學生學習潛在能力與自學能力測驗成績相關系數(shù)為0.891,問從總體上說,兩者是否存在相關?檢驗的步驟提出假設計算檢驗統(tǒng)計量的值統(tǒng)計決斷所以學生的學習潛在能力與自學能力之間存在著較高的正相關??系聽柡椭C系數(shù)(Kendall’stau-b)當多個(兩個以上)變量值以等級次序排列或以等級次序表示,描述這幾個變量之間的一致性程度的量,稱為肯德爾和諧系數(shù)。它常用來表示幾個評定者對同一組學生成績用等級先后評定多次之間的一致性程度。無相同等級的情況當同一位評定者對所有被評事物的評定無相同等級時,其肯德爾和諧系數(shù)的計算公式為:例:4位教師對6個學生作文競賽的名次排列次序如表第(2)列所示,問評定的一致性程度如何?
有相同等級的情況當同一位評定者對所有被評事物的評定有相同等級時,其肯德爾和諧系數(shù)的計算公式為:同一位教師對5份研究生入學考試政治試卷根據(jù)標準先后3次等級評定結果如下表所示,問3次評定結果的相關程度如何?質量相關分析質量相關是指一個變量為質,另一個變量為量,這兩個變量之間的相關。如智商、學科分數(shù)、身高、體重等是表現(xiàn)為量的變量,男與女、優(yōu)與劣、及格與不及格等是表現(xiàn)為質的變量。質與量的相關主要包括二列相關、點二列相關、多系列相關。二列相關當兩個變量都是正態(tài)連續(xù)變量.其中一個變量被人為地劃分成二分變量(如按一定標推將屬于正態(tài)連續(xù)變量的學科考試分數(shù)劃分成及格與不及格,錄取與未錄取,把某一體育項目測驗結果劃分成通過與未通過,達標與末達標,把健康狀況劃分成好與差,等等),表示這兩個變量之間的相關,稱為二列相關。
二列相關的使用條件
①兩個變量都是連續(xù)變量,且總體呈正態(tài)分布,或總體接近正態(tài)分布,至少是單峰對稱分布。②兩個變量之間是線性關系。③二分變量是人為劃分的,其分界點應盡量靠近中值。④樣本容量應當大于80。二列相關系數(shù)的計算公式
點二列相關
當兩個變量其中一個是正態(tài)連續(xù)性變量,另一個是真正的二分名義變量(例如,男與女,已婚和未婚,色盲與非色盲,生與死,等等),這時,表示這兩個變量之間的相關,稱為點二列相關。
多系列相關
當兩個變量都是正態(tài)連續(xù)變量,其中一個變量按不同質被人為地分成多種類別(兩類以上)的正態(tài)名義變量。表示正態(tài)連續(xù)變量與多類正態(tài)名義變量之間的相關,稱為多系列相關。例如,學生的智商與學習努力程度之間的關系,智商和學習努力程度都是正態(tài)連續(xù)變量,但學習努力程度被人為地分成“努力”、“中等”、“不努力”三種類別,二者的相關稱為三系列相關。又如,不同學習成績的學生對某種教學改革的態(tài)度分為“極其不贊成”、“不贊成。、“不置可否”、“贊成”、“極其贊成”。學習成績與態(tài)度之間的相關稱五系列相關。多系列相關系數(shù)的計算公式
品質相關分析兩個變量都是按質劃分成幾種類別,表示這兩個變量之間的相關稱為品質相關。如,一個變量按性別分成男與女,另一個變量按學科成績分成及格與不及格;又如,一個變量按學校類別分成重點及非重點,另一個變量按學科成績分成優(yōu)、良、中、差,等等。根據(jù)兩個變量的性質及所分類別的多少,分為四分相關、φ相關及列聯(lián)相關。四分相關
當兩個變量都是正態(tài)連續(xù)變量,且兩者呈直線關系,但兩者都被人為地劃分成二分變量,表示這兩個變量的相關,稱為四分相關。例如,將學科成績劃分成及格與不及格,達標與未達標,通過與未通過,將對事物的態(tài)度劃分成贊同與反對:將對問題的回答劃分成對與錯,等等。四分相關四分相關有多種計算方法,最常用的是皮爾遜的余弦π法,其計算公式為:
例如,45名學生跳高與跳遠成績(達標及未達標)如表所示,問跳高與跳遠成績的相關情況如何?
φ相關
當兩個變量都是二分變量,無論是真正的二分變量還是人為的二分變量,這兩個變量之間的關系,可以用由φ相關來表示。其計算公式為:
例如,從研究生入學考試的學生中,隨機抽取60人.其大學應屆與往屆畢業(yè)生錄取情況如表11.14,問應屆和往屆大學畢業(yè)生同研究生錄取與否的相關情況如何?列聯(lián)相關
當兩個變量均被分成兩個以上類別,或其中一個變量被分成兩個以上類別,表示這兩個變量之間的相關,稱為列聯(lián)相關。列聯(lián)相關系數(shù)的計算公式為:
數(shù)據(jù)類型與相關系數(shù)類型第一個變量數(shù)據(jù)類型第二個變量數(shù)據(jù)類型二分數(shù)據(jù)等級數(shù)據(jù)等距數(shù)據(jù)人為二分型真正二分型二分數(shù)據(jù)人為二分型四格相關Φ相關二列相關列聯(lián)系數(shù)二列相關真正二分型Φ相關Φ相關二列相關列聯(lián)系數(shù)點二列相關等級數(shù)據(jù)二列相關列聯(lián)系數(shù)二列相關列聯(lián)系數(shù)等級相關等級相關多列相關等距數(shù)據(jù)二列相關點二列相關等級相關多列相關積差相關偏相關分析所謂偏相關,是指在諸多相關的變量中,剔除其中的一個或若干個變量的影響后,兩個變量之間的相關關系。對應的相關分析即為偏相關分析。偏相關系數(shù)的計算公式假定有3個變量:x1、x2、x3,求剔除變量的影響后,變量和之間的偏相關系數(shù)r123:偏相關系數(shù)的顯著性檢驗公式距離相關分析距離相關分析是對觀測量之間或變量之間相似或不相似的程度的一種測量。距離相關分析可用于同一變量內部各個取值間,以考察其相互接近程度;也可用于變量間,以考察預測值對實際值的擬合優(yōu)度。它有助于分析復雜的數(shù)據(jù)集合。距離相關分析根據(jù)統(tǒng)計量不同,分為兩種:(1)不相似性測量,通過計算樣本之間或變量之間的距離來表示。(2)相似性測量,通過計算Pearson相關系數(shù)或Cosine相關系數(shù)來表示。根據(jù)分析對象不同,分為兩種:
樣本間分析和變量間分析。三、相關分析中的可能錯誤
相關系數(shù)r是對兩個變量之間線性關系的簡單度量,因此當r=0時,只表示兩個變量之間不存在線性相關關系,并不說明變量之間沒有任何關系,比如,它們之間可能存在非線性關系,如圖8.1(e)就屬于這種情況。三、相關分析中的可能錯誤
r的計算涉及到變量的標準差和協(xié)方差,其數(shù)值大小易受極端值的影響,特別是與自變量x的變化范圍有很大關系。這時會產(chǎn)生兩種情況:—是多數(shù)觀察值不相關時,個別極瑞值引起中度相關,如圖8.4(a);二是大多數(shù)觀察值存在線性相關,個別極端值使觀察數(shù)據(jù)呈非線性相關.如圖8.4(b)。
三、相關分析中的可能錯誤
在對兩個時間數(shù)列的相關分析中,r所表現(xiàn)的相關程度同樣本數(shù)據(jù)的時間范圍有很大關系。比如.兩個現(xiàn)象在某段時期內的相關關系為線性的.而整個發(fā)展過程可能是非線性的,如圖(a);或者在某段時期內無線性關系,而整個發(fā)展過程可能存在線性關系,如圖(b)三、相關分析中的可能錯誤根據(jù)樣本數(shù)據(jù)計算的r帶有—定的隨機性,樣本數(shù)據(jù)越少,隨機性則越大。對于不相關的兩個變量計算出的r不—定為0,有時甚至會很高。但較大的r值不一定就意味著兩個變量之間確實存在著較高的相關;反之,較小的r也不一定就意味著變量之間無相關關系,這就是所謂的虛假相關。為避免出現(xiàn)分析上的錯誤,在實際應用r時,必須對r的顯著性進行檢驗,r在統(tǒng)計上是否顯著,才是它能否作為變量之間線性關系度量的依據(jù)。四、應用(測驗分析)信度系數(shù)衡量一次測驗可靠性、穩(wěn)定性的統(tǒng)計指標叫做信度。通常用不同次測驗結果的相關系數(shù)來衡量,即信度系數(shù)α。信度的高低反映了測驗中隨機因素影響的大小,一次測驗中隨機因素影響小則信度大,隨機因素影響大則信度小。信度的種類(1)再測信度系數(shù)——用同一套問卷在兩個不同時間內來測試同一批對象,計算兩次測驗分數(shù)的相關系數(shù),又稱穩(wěn)定系數(shù)。(2)等值系數(shù)——用兩份等值的問卷對同一批對象進行測驗,計算兩次測驗分數(shù)的相關系數(shù),又稱復本信度。(3)內在一致性系數(shù)——一個測驗中所包含的各個項目上所的成績的一致性,又稱同質信度。估計信度的方法用于衡量再測信度、復本信度——積差相關法。用于計算內部一致性系數(shù)——折半相關分析法——克倫巴赫α系數(shù)法——庫德-理查遜(K-R)公式
四、應用(測驗分析)效度所謂效度,就是衡量測驗有效性、準確性的統(tǒng)計指標。實質上是指所測量到的東西與要測量的東西之間的相符合的程度。它與信度的區(qū)別在于:信度反映了測驗中隨機誤差的大小,而效度反映了測驗中系統(tǒng)誤差的大小。四、應用(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 平行線教育初中數(shù)學試卷
- 陶瓷養(yǎng)護系統(tǒng)用戶需求分析報告
- 隴縣九年級數(shù)學試卷
- 南通海門高中期末數(shù)學試卷
- 歷屆的小升初數(shù)學試卷
- 臨化小升初數(shù)學試卷
- 2025年氯化聚乙烯混煉膠項目建議書
- 漯河2024小升初數(shù)學試卷
- 梅縣區(qū)小升初數(shù)學試卷
- 醫(yī)療器械生產(chǎn)效率優(yōu)化分析報告
- 四川省事業(yè)單位公開招聘工作人員公共科目〈綜合知識〉筆試考試大綱筆試歷年典型考題及考點剖析附帶答案詳解
- 《中藥鑒定學》考試題庫大全-上(單選、多選題)
- 《保障中小企業(yè)款項支付條例(2025新修訂)》知識培訓
- 房地產(chǎn)大宗購買合作合同書
- 管道清淤施工方案
- 車衣改色培訓
- (高清版)DB37∕T 3535-2019 固定污染源廢氣監(jiān)測點位設置技術規(guī)范
- DB36-T 954-2024 低產(chǎn)低效林改造技術規(guī)程
- 浙教版七年級(上)科學期中試題卷及答案
- 二零二五版地質災害監(jiān)測與測量合同范本3篇
- 醫(yī)院防汛應急演練方案及流程安排
評論
0/150
提交評論