




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
直線相關與回歸分析第一頁,共四十頁,2022年,8月28日
分析兩個變量間的關系常用回歸及相關分析的統(tǒng)計方法。如兩個變量間的關系是線性的,可用直線相關與回歸分析;如兩個變量間的關系是非線性的需用非線性(曲線)回歸?;貧w分析適用于分析變量間的因果關系;用一個自變量的值來估計另一個應變量的值。相關分析用于分析兩變量間相互聯(lián)系的密切程度及相關方向。
第一節(jié)概述
第二頁,共四十頁,2022年,8月28日第二節(jié)相關系數(shù)
相關分析的目的在于通過相關系數(shù)r來描述和度量兩變量線性聯(lián)系的程度和方向。
r>0正相關圖例1r<0負相關圖例2r=0零相關圖例3
零相關即兩變量間無關。樣本相關系數(shù)不等于零,并不表示總體相關系數(shù)不等于零,還要作顯著性檢驗。next第三頁,共四十頁,2022年,8月28日r=0.7495回第四頁,共四十頁,2022年,8月28日r=-0.83597回第五頁,共四十頁,2022年,8月28日第六頁,共四十頁,2022年,8月28日
相關系數(shù)的計算:
X和Y的離均差積和X的離均差平方和第七頁,共四十頁,2022年,8月28日
相關系數(shù)的顯著性檢驗
樣本相關系數(shù)的標準誤查t界值表,得P值第八頁,共四十頁,2022年,8月28日
例6.1極譜法和碘量法測定水中溶解氧的含量,兩法的測得值是否有相關性?
兩法的測得值有相關(P<0.01)第九頁,共四十頁,2022年,8月28日
第三節(jié)直線回歸方程目的:找出描述x與y依存關系的直線方程。Y為應變量(dependentvariable)X為自變量(independentvariable)A為截距(intercept)b為回歸系數(shù)(regressioncoefficient)回歸系數(shù)b表示x每改變一個單位,y平均改變b個單位。第十頁,共四十頁,2022年,8月28日Y=10x+5
=4.22+0.20x體重心臟橫徑第十一頁,共四十頁,2022年,8月28日
設有n對x,y的觀察值,先在直角坐標系中作散點圖,如果散點的分布呈直線趨勢,則可設法求出直線方程。通常用最小二乘法,依據(jù):各點與該直線的縱向距離的平方和為最小先由(6.3)式求得b,再由(6.4)式求得a,就得出直線回歸程。
第十二頁,共四十頁,2022年,8月28日xy最小第十三頁,共四十頁,2022年,8月28日回歸系數(shù)的顯著性檢驗從樣本資料中算得的回歸系數(shù)b,也有抽樣誤差,因此需作顯著性檢驗,檢驗其是否是回歸系數(shù)為零的總體中抽得的。
H0:β=0H1:β≠0。當拒絕H0時,可認為x與y間的直線回歸方程有統(tǒng)計學意義。顯著性檢驗可有兩種方法:t檢驗法和方差分析法。第十四頁,共四十頁,2022年,8月28日
t檢驗法:樣本回歸系數(shù)的標準誤剩余標準差估計誤差平方和第十五頁,共四十頁,2022年,8月28日方差分析法:Y的總變異X和Y的線性關系引起的變異誤差引起的變異回歸平方和誤差平方和第十六頁,共四十頁,2022年,8月28日總的自由度:n-1(總例數(shù)減1)回歸自由度:1(自變量個數(shù))誤差自由度:n-2(總的自由度減去回歸自由度)df1=1,df2=n-2查方差分析用的F界值表,得P值第十七頁,共四十頁,2022年,8月28日例6.2
研究正常男性年齡與運動后最大心率的關系,求直線回歸方程。第十八頁,共四十頁,2022年,8月28日直線回歸相關分析的注意事項:
1.相關分析只是以相關系數(shù)來描述兩個變量間線性相關的程度和方向,并不闡明事物間存在聯(lián)系的本質,也不是兩事物間存在聯(lián)系的證據(jù)。要闡明兩事物間的本質聯(lián)系,必須憑專業(yè)知識從理論上加以論證。因此,把兩個毫無關系的事物放在一起作相關分析是毫無意義的。同樣,作回歸分析也要有實際意義。
第十九頁,共四十頁,2022年,8月28日第二十頁,共四十頁,2022年,8月28日直線回歸相關分析的注意事項:在進行直線回歸前應繪制散點圖,有直線趨勢時,才適宜作直線回歸分析。散點圖還能提示資料有無異常點。3.直線回歸方程的適用范圍一般以自變量的取值范圍為限。第二十一頁,共四十頁,2022年,8月28日直線回歸相關分析的注意事項:
4.對同一組資料作回歸和相關分析,其相關系數(shù)和回歸系數(shù)的顯著性檢驗結果完全相同。由于相關系數(shù)的顯著性檢驗結果可直接查表,比較方便;而回歸系數(shù)的顯著性檢驗計算復雜,故在實際應用中常用相關系數(shù)的顯著性檢驗結果代替回歸系數(shù)的顯著性檢驗。第二十二頁,共四十頁,2022年,8月28日直線回歸相關分析的注意事項:5.在資料要求上:相關分析要求兩個變量服從雙變量正態(tài)分布。回歸分析要求因變量服從正態(tài)分布,自變量可以是精確測量和嚴格控制的變量。如兩個變量服從雙變量正態(tài)分布,則可以作兩個回歸方程,用X推算Y,或用Y推算X。
第二十三頁,共四十頁,2022年,8月28日第五節(jié)過定點的直線回歸醫(yī)學研究中在擬合直線時,除了要求與觀察點盡量接近外,還常常要求必須經(jīng)過某定點(m,n)。例如在光電比色、熒光分析、火焰光度測定以及同位素測定等實驗方法繪制標準直線時就常有這樣的要求。此定點也可以是(m,0),(0,n)或(0,0)等,尤以(0,0)為最常見。計算公式和實例見第116頁。第二十四頁,共四十頁,2022年,8月28日第六節(jié)直線相關與回歸的SAS程序
SAS的CORR過程可用于求變量之間的線性相關系數(shù)及偏相關系數(shù)。;
SAS的REG過程可用于各種線性回歸分析,包括多元回歸(見第七章),逐步回歸和最優(yōu)子集回歸(見第八章)等。第二十五頁,共四十頁,2022年,8月28日第七章多元回歸及相關第一節(jié)多元線性回歸的基本概念
事物間的相互聯(lián)系往往是多方面的,在很多情況下對應變量y發(fā)生影響的自變量往往不止一個。多元線性回歸的目的就是用一個多元線性回歸方程表示多個自變量和1個應變量間的關系。:截距:標準偏回歸系數(shù)標準偏回歸系數(shù)表示其他自變量固定的情況下,xi改變一個單位,y平均改變bi個單位。第二十六頁,共四十頁,2022年,8月28日多元線性回歸的應用條件:1.獨立性:各觀察對象間相互獨立。2.線性:自變量與應變量間的關系為線性。正態(tài)性:自變量取不同值時,應變量的分布為正態(tài)。方差齊性:自變量取不同值時,應變量的總體方差相等。當不符合條件時,可對自變量進行變換。如:第二十七頁,共四十頁,2022年,8月28日第二節(jié)多元回歸的計算
1.計算截距和各偏回歸系數(shù)。2.多元回歸方程的顯著性檢驗:(1)整個方程的顯著性檢驗:用方差分析。(2)對各偏回歸系數(shù)的顯著性檢驗:F檢驗:去掉xj后回歸平方和的減少是否顯著。t檢驗:回歸系數(shù)除以它的標準誤。第二十八頁,共四十頁,2022年,8月28日第三節(jié)標準偏回歸系數(shù)
要比較各個自變量對于應變量的作用大小,不能用偏回歸系數(shù),因為各偏回歸系數(shù)的單位不同。必須把偏回歸系數(shù)標準化,化成沒有單位的標準偏回歸系數(shù),公式為:消除不同單位的影響后,標準偏回歸系數(shù)的絕對值越大,該自變量對于應變量的作用越大,但該差別是否有統(tǒng)計意義,也必須經(jīng)過檢驗。第二十九頁,共四十頁,2022年,8月28日第四節(jié)偏相關系數(shù)
相關系數(shù)r應稱為簡單相關系數(shù),因為它只考慮了x1和
x2之間的相互影響,而未注意到其他變量對x1和x2可能有的影響。事實上,客觀事物間的關系是錯綜復雜的,變量之間的相互影響也往往是多種多樣的。例如,當存在x1,x2,x3三個變量時,如果我們不考慮x3
,而只對x1,x2計算其相關系數(shù)r,則這r的大小往往不反映客觀真實情況;如r很大,可能意味著x1,x2之間的關系很密切,但也可能實際上x1,x2之間并無什么關系,而x3卻對x1,x2能同時發(fā)揮很大的影響,我們所看到的較大r值不過是x3對x1的作用和x3對x2的作用的客觀表現(xiàn)而已。反之,x1,x2之間算得的一個小r值,也不一定就意味著x1,x2之間的關系確實薄弱,也有可能x1,x2之間雖有關聯(lián),但此關聯(lián)性卻被x3對它們的作用所抵消,以致被掩蓋了。第三十頁,共四十頁,2022年,8月28日因此在較單純的情況下,如果x1,x2與周圍其他變量沒什么關系的話,則用簡單相關系數(shù)來表示x1,x2之間的相關性是可行的;如果存在著對x1,x2關系密切的其他變量,則r就不能確切地表示x1,x2之間的真實關系,這就需要用到偏相關系數(shù)。所謂偏相關系數(shù)指的是當把x1,x2以外的其他變量對它們的影響都扣除掉(或平衡掉)以后,x1,x2之間的相關系數(shù)。表示把x3的作用扣除掉以后x1
和x2的偏相關系數(shù)表示把x3和x4的作用扣除掉以后x1
和x2的偏相關系數(shù)偏相關系數(shù)可從簡單相關系數(shù)計算得到,也要作顯著性檢驗。第三十一頁,共四十頁,2022年,8月28日第五節(jié)多元相關系數(shù)及決定系數(shù)在多元回歸中可算得一個多元相關系數(shù),用R表示,它是y與之間的簡單相關系數(shù),也可理解為y與自變量組合之間的相關系數(shù)。
R2稱為多元回歸方程的決定系數(shù),即y的變異中可由方程中的自變量組合所決定的部分。
R2值介于0~1之間,R2越接近1,說明回歸方程的效果越好。R2越接近0,說明回歸方程的效果越差,即y的變異中只有很少一部分能由方程中的自變量組合所決定,即使該方程有顯著意義,也不能認為該方程的效果可以令人滿意,啟示我們還應進一步尋找其他對y可能有顯著作用的變量或變量組合。R2也可用于檢驗多元回歸方程的顯著性。第三十二頁,共四十頁,2022年,8月28日第六節(jié)多元回歸在醫(yī)學中的應用
1.一。根據(jù)較易測得的自變量推算不易測得的應變量如:用身高,體重推算體表面積。二。確定各自變量xi取不同值時,y的正常值范圍如:建立一個由身高,體重推算心象面積的多元回歸方程,利用此方程就可分別求出身高,體重取不同值的組合時,心象面積的正常值范圍。三。預測預報如:建立心肌梗塞預報方程或腦卒中預報方程。四。回顧推斷如:推斷死亡時間。
第三十三頁,共四十頁,2022年,8月28日第七節(jié)多元回歸及相關的SAS程序
求偏相關系數(shù)用CORR過程。求多元回歸及相關用REG過程。第三十四頁,共四十頁,2022年,8月28日第八章逐步回歸及最優(yōu)子集回歸第一節(jié)逐步回歸分析一.逐步回歸分析的基本概念逐步回歸分析的目的是建立“最優(yōu)”回歸方程。
“最優(yōu)”回歸方程是指包含所有對y有顯著作用的自變量,而不包含對y作用不顯著的自變量的方程。第三十五頁,共四十頁,2022年,8月28日二.逐步回歸分析的計算方法在供選的自變量Xi中,按其對y的作用大小,由大到小地把自變量逐個引入方程,每引入一個自變量就對它作顯著性檢驗,顯著時才引入,而當新的自變量進入方程后,對方程中原有的自變量也要作檢驗,并把作用最小且退化為不顯著的自變量逐個剔出方程。因此,逐步回歸的每一步(引入一個變量或剔除一個變量都稱為一步)前后都要作顯著性檢驗,以保證每次引入新變量前方程中只包含作用顯著的自變量。這樣一步步進行下去,直至方程中所含自變量都顯著而又沒有新的作用顯著的自變量可引入方程為止。第三十六頁,共四十頁,2022年,8月28日逐步回歸分析方法示意:yx1、x2、x3、……
xmxjXj是否顯著結束引入方程方程內自變量中選擇對y作用最小的xi剔除方程外:作用最大的自變量:第三十七頁,共四十頁,2022年,8月28日第三節(jié)最優(yōu)子集回歸回歸方程優(yōu)劣的評價:(P為選入方程的自變量數(shù))1.剩余標準差最?。?.變異系數(shù)最?。?.復相關系數(shù)最大:4.校正
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院開幕式課件
- 2025-2030中國醫(yī)療AI輔助診斷系統(tǒng)注冊審批難點與醫(yī)院采購流程
- 2025-2030中國冷鏈物流裝備智能化升級與生鮮電商協(xié)同發(fā)展報告
- 2025勞動合同書樣本模板
- 醫(yī)院應急管理培訓課件
- 2025年企業(yè)合同管理面臨的挑戰(zhàn)與應對策略
- 醫(yī)院導管安全知識培訓內容課件
- 醫(yī)院安全知識培訓課件小結
- 醫(yī)院培訓課件
- 2025南京市購銷合同范本
- 2025年咖啡師咖啡品質評定實操考核試題及答案
- 2025年西藏自治區(qū)輔警招聘考試考試試題庫及一套完整答案詳解
- 辦公樓建設工程設計方案
- 腸破裂修補術護理病例討論
- 原料藥中亞硝胺雜質的風險評估實操
- 2025年醫(yī)療器械管理人員考試試卷及答案
- 西安市自來水有限公司招聘考試真題2024
- 水洗泥項目可行性研究報告模板及范文
- 2025年廣東省康復產(chǎn)業(yè)藍皮書-前瞻產(chǎn)業(yè)研究院
- 2025至2030年中國中間相炭微球行業(yè)市場運行格局及產(chǎn)業(yè)需求研判報告
- 2025年陜西、山西、寧夏、青海高考化學真題+解析(參考版)
評論
0/150
提交評論