第六章 相關(guān)和回歸5.13_第1頁
第六章 相關(guān)和回歸5.13_第2頁
第六章 相關(guān)和回歸5.13_第3頁
第六章 相關(guān)和回歸5.13_第4頁
第六章 相關(guān)和回歸5.13_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第六章相關(guān)與回歸分析

(CorrelationandRegression)060120180施氮量(kgN/ha)2468植物的生長量學習目的1.相關(guān)與回歸的概念;2.直線相關(guān)與直線回歸分析;3.多重線性回歸分析。學習內(nèi)容1.直線相關(guān)2.秩相關(guān)3.直線回歸4.曲線回歸5.多重線性回歸第一節(jié)直線相關(guān)一、相關(guān)關(guān)系的概念相關(guān)關(guān)系變量之間的依存關(guān)系確定性、嚴格的依存關(guān)系

函數(shù)關(guān)系不確定、不規(guī)則

的依存關(guān)系,宏觀關(guān)系相關(guān)關(guān)系的特點:(1)現(xiàn)象之間確實存在數(shù)量上的依存關(guān)系。(2)現(xiàn)象之間數(shù)量上的依存關(guān)系不是確定的。

聯(lián)系(1)本來具有函數(shù)關(guān)系的變量,當在觀測誤差時,其函數(shù)關(guān)系往往以相關(guān)的形式表現(xiàn)出來。(2)如果我們對所研究對象有更深入的認識,便可以將影響因素全部納入方程,使之成為函數(shù)關(guān)系。相關(guān)關(guān)系與函數(shù)關(guān)系存在區(qū)別,但在一定的條件下是可以相互轉(zhuǎn)換的。區(qū)別:(1)兩變量之間的關(guān)系是否確定(2)是否可用數(shù)學公式表式直線相關(guān)又稱簡單線性相關(guān),是描述兩變量間是否有線性關(guān)系以及線性關(guān)系的方向和密切程度的統(tǒng)計分析方法。直線相關(guān)用于雙變量正態(tài)分布資料,兩變量之間的直線相關(guān)關(guān)系用相關(guān)系數(shù)來描述。樣本相關(guān)系數(shù)用r表示,總體相關(guān)系數(shù)用ρ表示。(一)相關(guān)關(guān)系的種類按相關(guān)的程度,可分為完全相關(guān)不完全相關(guān)不相關(guān)正相關(guān)負相關(guān)線性相關(guān)非線性相關(guān)單相關(guān)復相關(guān)按涉及變量的多少,可分為按相關(guān)的形式,可分為按相關(guān)的方向,可分為按相關(guān)的程度按相關(guān)程度劃分完全相關(guān):當一種現(xiàn)象的數(shù)量變化完全由另一個現(xiàn)象的數(shù)量變化所確定時,這兩種現(xiàn)象間的關(guān)系為完全相關(guān)。即函數(shù)關(guān)系。不完全相關(guān):兩個現(xiàn)象之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān)。不相關(guān):當兩個現(xiàn)象彼此互不影響,其數(shù)量變化各自獨立時,稱為不相關(guān)。如:股票價格的高低與氣溫的高低是不相關(guān)的。直線相關(guān)按相關(guān)方向劃分正相關(guān):當一個現(xiàn)象的數(shù)量由小變大,另一個現(xiàn)象的數(shù)量也相應由小變大,這種相關(guān)稱為正相關(guān)。如工人的工資隨勞動生產(chǎn)率的提高而增加。

負相關(guān):當一個現(xiàn)象的數(shù)量由小變大,而另一個現(xiàn)象的數(shù)量相反地由大變小,這種相關(guān)稱為負相關(guān)。如商品流轉(zhuǎn)的規(guī)模越大,流通費用水平則越低。按相關(guān)形式劃分線性相關(guān):當兩種相關(guān)現(xiàn)象之間的關(guān)系大致呈現(xiàn)為線性關(guān)系時,稱之為線性相關(guān)。如人均消費水平與人均收入水平通常呈線性關(guān)系。非線性相關(guān):如果兩種相關(guān)現(xiàn)象之間,并不表現(xiàn)為直線的關(guān)系,而是近似于某種曲線方程的關(guān)系,則這種相關(guān)關(guān)系稱為非線性相關(guān)。如產(chǎn)品的平均成本與產(chǎn)品總產(chǎn)量之間的相關(guān)關(guān)系就是一種非線性關(guān)系。按變量多少劃分單相關(guān):一個變量對另一個變量的相關(guān)關(guān)系,稱為單相關(guān)。

復相關(guān):當所研究的是一個變量對兩個或兩個以上其他變量的相關(guān)關(guān)系時,稱為復相關(guān)。如某種商品的需求與其價格水平及人們收入水平之間的相關(guān)關(guān)系就是一種復相關(guān)。

散點圖直觀的說明直線相關(guān)的性質(zhì)(二)相關(guān)系數(shù)

定量描述兩變量間直線相關(guān)方向和密切程度的統(tǒng)計指標。以兩變量與各自平均值的離均差為基礎(chǔ)。積差相關(guān)系數(shù)(Product-momentcorrelationcoefficient)Pearson相關(guān)系數(shù),相關(guān)系數(shù)。參數(shù)統(tǒng)計。-1≤r≤1符號→相關(guān)方向絕對值→密切程度r>0:正相關(guān)。r<0:負相關(guān)。r=0:零相關(guān)。非線性相關(guān)or無相關(guān)。不服從雙變量正態(tài)分布→變量變換→正態(tài)化→Pearson積差相關(guān)系數(shù)。二、相關(guān)系數(shù)的假設(shè)檢驗r估計總體相關(guān)系數(shù)ρ,當r≠0時,因為存在抽樣誤差,不能認為ρ≠0,需要檢驗樣本相關(guān)關(guān)系是否來自ρ=0的總體。相關(guān)系數(shù)采用t檢驗方法,df=n-2

三、直線相關(guān)分析步驟1.雙變量正態(tài)性檢驗:x、y是否滿足正態(tài)性2.散點圖:直線趨勢→直線回歸、曲線趨勢→曲線方程。3.計算r:4.r的假設(shè)檢驗:四、注意事項1.選擇合適的回歸模型:在計算相關(guān)系數(shù)之前先用散點圖觀察兩變量之間是否有線性聯(lián)系,曲線聯(lián)系時不能用直線相關(guān)分析。2.X,Y中任意一個變量的數(shù)值是認為選定時不應作直線相關(guān)分析。3.做相關(guān)分析時,要剔除異常點(離群值)4.專業(yè)上要有意義:兩變量相關(guān)并不代表兩變量之間一定存在內(nèi)在聯(lián)系,如兒童身高與小樹樹高計算得的相關(guān)系數(shù)。5.分層資料不要盲目合并作直線相關(guān)分析:如不同年齡人群體重與年齡的關(guān)系,以自變量的觀測范圍為限,隨意外延。表9-1某地10名三歲兒童的體重與體表面積數(shù)據(jù)P111【SPSS操作】以“(胰島素)”、“(血糖)”為變量名,建立2列20行數(shù)據(jù)集li0601.sav。

(1)正態(tài)性檢驗:Analyze

DescriptiveStatistics→explore

→胰島素、血糖入Dependentvariable→plots→Nomalityplotswithtests

→OK(2)作散點圖:Graphs(繪圖)→LegacyDialogs→Scatter/Dot(散點圖)→SimpleScatter→Define,“血糖”→YAxis(軸)框,“胰島素”→XAxis(軸)框,→OK。(3)線性相關(guān)

Analyze→Correlate→Bivariate,血糖”與“胰島素”→Variables→Pearson→Two-tailed→OK。第二節(jié)

等級相關(guān)(秩相關(guān))

等級相關(guān)是一種非參數(shù)統(tǒng)計的方法。條件:①雙變量中的一個或兩個不服從正態(tài)分布;②總體分布類型不知;③用等級或相對數(shù)表示的資料;④數(shù)據(jù)一端或兩端有不確定值。方法:Kendall法:等級相關(guān)系數(shù)rkSpearman法:等級相關(guān)系數(shù)rsrk和rs的取值范圍和意義同r,都需進行檢驗。取值范圍都在-1到1之間。需要做總體相關(guān)系數(shù)等于0的假設(shè)檢驗。等級相關(guān)系數(shù)的假設(shè)檢驗用z檢驗。P112【SPSS操作】以“血小板數(shù)”和“出血癥狀”為變量名,建立2列12行數(shù)據(jù)集li0602.sav。

Analyze→Correlate→Bivariate,“血小板數(shù)”、“出血癥狀”→Variables框,在CorrelationCoefficients選項下選擇復選框Spearman,在TestofSignificance下選中Two-tailed→OK。

第三節(jié)直線回歸

對具有高度相關(guān)關(guān)系的現(xiàn)象,根據(jù)其相關(guān)的形態(tài),建立一個適宜的數(shù)學模型(回歸方程),來近似地反映變量之間的一般變化關(guān)系,利用所建立的數(shù)學模型進行估計和預測,這個數(shù)學模型就是回歸方程。自變量與因變量在回歸分析中,需要搞清是哪一個變量的變動影響另一個變量的變動,即分清自變量和因變量。起影響作用的變量叫自變量,用X表示;由于自變量的變動而發(fā)生對應變化的變量叫因變量,用Y表示。研究一個自變量與一個因變量,且這兩個變量之間呈直線關(guān)系的回歸分析成為直線回歸分析。研究多個自變量與一個因變量,且這些變量之間呈直線關(guān)系的回歸分析成為多重線性回歸分析。相關(guān)分析與回歸分析相關(guān)分析就是用一個指標來表明現(xiàn)象間相互依存關(guān)系的密切程度。回歸分析就是根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個合適的數(shù)學模型,來近似地表達變量間的平均變化關(guān)系。

區(qū)別

①相關(guān)分析所研究的變量是對等關(guān)系;回歸分析所研究的兩個變量不是對等關(guān)系。②對兩個變量來說,相關(guān)分析只能計算出一個相關(guān)系數(shù),而回歸分析,可分別建立兩個不同的回歸方程。③相關(guān)分析要求兩個變量都必須是隨機的,而回歸分析的要求,自變量是給定的,因變量是隨機的。一、直線回歸的模型

一元線性回歸模型是最簡單的回歸模型,又稱為簡單線性回歸或簡單回歸:只有一個自變量的直線回歸。在一元線性回歸模型中,X為可以精確測定和控制的變量,且當X取得某確定值時,對應的Y值相互獨立,服從正態(tài)分布。圖6-8簡單線性回歸統(tǒng)計學模型μy=α+βx總體回歸方程樣本直線回歸方程

a:截距(intercept)。b:斜率(slope),回歸系數(shù)

x每改變1個單位時y平均改變b個單位。b>0表示自變量↑應變量↑,直線上升。│b│↑→越陡→y隨x變化率大。b=0,表示回歸直線與X軸平行,即X與Y無直線關(guān)系。二、直線回歸分析的應用條件:1、XY具有線性相關(guān)關(guān)系2、對于每一個確定的X,相應的Y值間獨立3、Y值具有正態(tài)性。4、對于任意一組自變量值,因變量Y具有相同的方差三、直線回歸方程的建立、檢驗與應用

1.建立:最小二乘法原則,使各個實測點到回歸直線縱向距離的平方和最小。a,b的計算公式由此推導出來。

2.應用:在樣本數(shù)據(jù)范圍內(nèi)。3.檢驗:用樣本數(shù)據(jù)建立的直線回歸方程是樣本方程,樣本方程是否能在總體上反

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論