93-spss多元回歸分析教案省公開課一等獎全國示范課微課金獎?wù)n件_第1頁
93-spss多元回歸分析教案省公開課一等獎全國示范課微課金獎?wù)n件_第2頁
93-spss多元回歸分析教案省公開課一等獎全國示范課微課金獎?wù)n件_第3頁
93-spss多元回歸分析教案省公開課一等獎全國示范課微課金獎?wù)n件_第4頁
93-spss多元回歸分析教案省公開課一等獎全國示范課微課金獎?wù)n件_第5頁
已閱讀5頁,還剩33頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

SPSS回歸分析第1頁影響因變量自變量只有一個變量稱之為一元,有兩個或兩個以上時候稱之為多元,假如他們之間有線性關(guān)系,就是線性回歸。線性關(guān)系確實定方法:對于多元情況,繪制每個自變量與因變量散點圖,并經(jīng)過相關(guān)性檢驗確定它們之間存在線性關(guān)系;對于不存在線性關(guān)系變量,則找出它們之間非線性關(guān)系,之后再利用非線性關(guān)系將相關(guān)數(shù)據(jù)線性化(如y=a*lnx,則將全部數(shù)據(jù)取自然對數(shù))。從而確定全部變量都與因變量存在線性關(guān)系,為進行多元線性回歸做好準(zhǔn)備。一、線性回歸模型確實定第2頁二、線性回歸模型一元線性回歸方程:y=a+bxa稱為截距b為回歸直線斜率多元線性回歸方程:y=b0+b1x1+b2x2+…+bnxnb0為常數(shù)項b1、b2、…、bn稱為y對應(yīng)于x1、x2、…、xn回歸系數(shù)一元線性回歸模型確實定:普通先做散點圖,方便進行簡單地觀察,若散點圖趨勢大約呈線性關(guān)系,能夠建立線性方程,若不呈線性分布,可建立其它方程模型,并比較R2來確定一個最正確方程式(曲線預(yù)計)。

第3頁二、多元線性回歸模型統(tǒng)計檢驗1、多重共線性分析(僅多元回歸分析檢驗)

多重共線性是指解釋變量之間存在線性相關(guān)關(guān)系現(xiàn)象,該現(xiàn)象存在會造成:有可能回歸方程F統(tǒng)計量高度顯著,而每個t統(tǒng)計量不顯著,嚴(yán)重影響回歸效果。測度多重共線性普通有以下方式:(spass操作:分析-回歸-線性-在統(tǒng)計量對話框中選共線性分析)1、容差越大則與方程中其它自變量共線性越低,應(yīng)進入方程.含有太小容忍度變量不應(yīng)進入方程,spss會給出警告。

判斷方法:容差<0.1普通認為該變量與其它變量有多重共線性問題。2、方差膨脹因子(VIF):容差倒數(shù)3、條件索引。指最大特征根與第i個特征根比平方根。

判斷方法:通常,當(dāng)條件索引在0-10之間時說明多重共線性較弱;當(dāng)條件指數(shù)在10-100之間說明多重共線性較強;當(dāng)條件指數(shù)大于100時說明存在嚴(yán)重多重共線性。注:對存在共線性變量應(yīng)去除,逐步刪除容差最小變量,spass會自動去除共線性變量,并給出相關(guān)結(jié)果。(選“進入”方法則不會)第4頁二、線性回歸模型統(tǒng)計檢驗2、回歸方程擬合優(yōu)度

回歸直線與各觀察點靠近程度稱為回歸方程擬合優(yōu)度,也就是樣本觀察值聚集在回歸線周圍緊密程度。其檢驗統(tǒng)計量與一元線性回歸相同:說明:R2表達了回歸方程所能解釋因變量變差百分比;1-R2則表達了因變量總變差中,回歸方程所無法解釋百分比。R2越靠近于1,則說明回歸平方和占了因變量總變差平方和絕大部分百分比,因變量變差主要由自變量不一樣取值造成,回歸方程對樣本數(shù)據(jù)點擬合得好。Spss中相關(guān)結(jié)果在“模型匯總b”中第5頁二、線性回歸模型統(tǒng)計檢驗3、回歸方程顯著性檢驗(方差分析F檢驗)

回歸方程顯著性檢驗是要檢驗被解釋變量與全部解釋變量之間線性關(guān)系是否顯著。

原假設(shè)H0:β=0即:回歸系數(shù)與0無顯著差異一元回歸分析檢驗統(tǒng)計量:多元回歸分析檢驗統(tǒng)計量:

計算F統(tǒng)計量值和相伴概率p(spss中為sig,默認應(yīng)小于0.05),假如F值較大且p<=a,則拒絕H0,即:回歸系數(shù)與0有顯著差異,則說明自變量造成因變量線性變動遠大于隨機原因?qū)σ蜃兞坑绊?自變量于因變量之間線性關(guān)系較顯著。反之,不能拒絕H0。spss結(jié)果在分析表“Anovab”中。第6頁二、線性回歸模型統(tǒng)計檢驗4、回歸系數(shù)顯著性檢驗(t檢驗)

回歸系數(shù)顯著性檢驗是要檢驗回歸方程中被解釋變量與每一個解釋變量之間線性關(guān)系是否顯著。H0:βi=0即:回歸系數(shù)與0無顯著差異一元回歸分析檢驗統(tǒng)計量多元回歸分析檢驗統(tǒng)計量

計算t統(tǒng)計量值和相伴概率p(spss中為sig,默認應(yīng)小于0.05),p<=a,拒絕H0,即:回歸系數(shù)與0有顯著差異,則說明自變量造成因變量線性變動遠大于隨機原因?qū)σ蜃兞坑绊?自變量于因變量之間線性關(guān)系較顯著。反之,不能拒絕H0。spss中相關(guān)結(jié)果在

“系數(shù)a”中。注:對于顯著性不高變量應(yīng)去除,再回歸。第7頁二、多元線性回歸模型統(tǒng)計檢驗5、殘差分析(在統(tǒng)計量中勾選durbin-watson,在繪制中勾選正態(tài)圖)

殘差是指由回歸方程計算得到預(yù)測值與實際樣本值之間差距,定義為:

對于線性回歸分析來講,假如方程能夠很好反應(yīng)被解釋變量特征和規(guī)律性,那么殘差序列中應(yīng)不包含顯著規(guī)律性。1、檢驗殘差分布是否為正態(tài),普通用p-p圖,假如各觀察散點均勻地分布在對角線上,能夠判斷殘差服從正態(tài)分布。2、檢驗殘差獨立性(DW檢驗)。DW檢驗用來檢驗殘差自相關(guān)。檢驗統(tǒng)計量為:

判斷:DW=2表示無自相關(guān),在0-2之間說明存在正自相關(guān),在2-4之間說明存在負自相關(guān)。普通情況下,DW值在1.5-2.5之間即可說明無自相關(guān)現(xiàn)象。殘差序列不存在自相關(guān),能夠認為回歸方程基本概括了因變量改變;不然,認為可能一些與因變量相關(guān)原因沒有引入回歸方程或回歸模型不適當(dāng)?shù)?。?頁三、回歸模型結(jié)果檢驗回歸分析模型中,除進行各種統(tǒng)計檢驗外,在數(shù)據(jù)較多情況下,可在回歸分析中去掉最終一個數(shù)據(jù),用以檢驗。在得到回歸模型后,用其預(yù)測最終一個數(shù)據(jù),并與真實值進行比較,看其是否在置信區(qū)間內(nèi),來檢驗?zāi)P秃侠硇?。Spss操作以下:在“回歸分析”對話框中,選“保留”按鈕,在其中勾選保留預(yù)測值和均值置信區(qū)間。第9頁一元線性回歸舉例1問題:某企業(yè)近年來科研支出x與利潤y統(tǒng)計資料以下表(單位:10萬元)。將x與y數(shù)據(jù)繪制出散點圖,觀察x與y含有線性關(guān)系。計算出y關(guān)于x線性回歸模型y=ax+b,并檢驗該模型是否顯著以及給出模型標(biāo)準(zhǔn)誤差。散點圖:圖形→舊對話框→散點/點狀,選擇簡單分布,再選入相關(guān)變量,最終確定。如右圖,初步確定它們之間存在線性關(guān)系??蒲兄С隼麧?1.0040.004.0030.005.0034.003.0025.002.0020.00第10頁選擇方法:分析→回歸→線形→將y送入自變量框,將x送入因變量框,在統(tǒng)計量對話框中選擇回歸系數(shù)置信區(qū)間和DW殘差獨立性檢驗,在繪制對話框中選正太概率圖(p-p圖),→確定運行。一元線性回歸舉例1第11頁統(tǒng)計量對話框說明:預(yù)計:輸出相關(guān)回歸系數(shù)統(tǒng)計量,包含回歸系數(shù)、回歸系數(shù)標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)化回歸系數(shù)、t統(tǒng)計量及其對應(yīng)p值等。置信區(qū)間:輸出每個回歸系數(shù)95%置信度預(yù)計區(qū)間。協(xié)方差矩陣:輸出解釋變量相關(guān)系數(shù)矩陣協(xié)方差陣。模型擬合度:輸出可決系數(shù)、調(diào)整可決系數(shù)、回歸方程標(biāo)準(zhǔn)誤差、回歸方程F檢驗方差分析。Durbin-watson:殘差獨立性檢驗第12頁結(jié)果分析:模型匯總表判定系數(shù)R=0.909,R2=0.826,說明y有82.6%是由變量x引發(fā),預(yù)計誤差是指預(yù)計值與觀察值平均差異程度,用s表示,s2是總體方差無偏預(yù)計量。預(yù)計標(biāo)準(zhǔn)誤差值越小,則預(yù)計量與其真實值近似誤差越小。

注:預(yù)計誤差只能說越小越好,并不能準(zhǔn)確說明回歸線代表性怎樣,所以其實際參考意義有限,普通不作分析(包含回歸系數(shù)標(biāo)準(zhǔn)誤差)。模型匯總b模型RR方調(diào)整R方標(biāo)準(zhǔn)預(yù)計誤差Durbin-Watson1.909a.826.7833.240371.500a.預(yù)測變量:(常量),x。

b.因變量:y第13頁結(jié)果分析:方差分析表方差分析表:對回歸模型進行顯著性檢驗,回歸顯著性概率sig.=0.012<0.05,所以回歸顯著??傋儾钇椒胶蚐ST為242,回歸平方和SSR為200,殘差平方和SSE為42。R2=SSR/SSTdf為自由度

F(0.012,1,4)=19.048遠大于F(0.05,1,4)=

7.709

所以回歸方程相關(guān)性比較顯著。(F值可在Excel中用FINV函數(shù)取得)。Anovab模型平方和df均方FSig.1回歸200.0001200.00019.048.012a殘差42.000410.500

總計242.0005

a.預(yù)測變量:(常量),x。b.因變量:y第14頁Excel中獲取F值(注:要求為版或者用wps

)步驟:在Excel函數(shù)選項下拉列表中選擇其它函數(shù),在選擇類別中選擇“統(tǒng)計”,再選擇“FINV”函數(shù),點擊確定,打開函數(shù)參數(shù)窗口,以下:輸入對應(yīng)控制水平、第1自由度和第2自由度,便可得到對應(yīng)F值(計算結(jié)果)第15頁回歸模型為:y=20+2x結(jié)果分析:系數(shù)表常量和解釋變量xt統(tǒng)計量相伴概率p分別為0.008和0.031,小于顯著性水平0.05,所以,在0.05顯著性水平下常量和解釋變量x都經(jīng)過了t檢驗。常量和解析變量x系數(shù)95%置信區(qū)間分別為:(9.981,29.619),(0.340,3.660)第16頁殘差分析:殘差反應(yīng)預(yù)測值與觀察值偏離情況,只能說越小越好,并不能準(zhǔn)確說明回歸線代表性怎樣,所以其實際參考意義有限,普通經(jīng)過殘差p-p圖來判斷回歸模型優(yōu)劣。結(jié)果分析:殘差分析殘差統(tǒng)計量a

極小值極大值均值標(biāo)準(zhǔn)偏差N預(yù)測值23.800041.800029.80007.071075殘差-3.800004.0.000003.193745標(biāo)準(zhǔn)預(yù)測值-.8491.697.0001.0005標(biāo)準(zhǔn)殘差-1.0301.139.000.8665a.因變量:y第17頁★鑒于模型各項檢驗都有顯著性,殘差服從正態(tài)分布且相互獨立,所以該模型是一個很好模型。結(jié)果分析:殘差分析1、為了判斷隨機擾動項是否服從正態(tài)分布,觀察右圖所表示標(biāo)準(zhǔn)化殘差P-P圖,能夠發(fā)覺,各觀察散點均勻地分布在對角線上,據(jù)此能夠判斷殘差服從正態(tài)分布。注:可經(jīng)過殘差圖觀察是否有異常點,如有則應(yīng)進行相關(guān)處理后再進行回歸2、由模型匯總表可得DW=1.5在1.5-2.5之間,說明殘差經(jīng)過獨立性檢驗,無自相關(guān)現(xiàn)象。第18頁問題:現(xiàn)有1987~湖南省全社會固定資產(chǎn)投資總額NINV和GDP兩個指標(biāo)年度數(shù)據(jù),見下表。試研究全社會固定資產(chǎn)投資總額和GDP數(shù)量關(guān)系,并建立全社會固定資產(chǎn)投資總額和GDP之間線性回歸方程。Spss操作參考例題1年份固定資產(chǎn)投入GDP1987.00120.38509.441988.00144.71614.071989.00114.51682.801990.00121.24744.441991.00156.39833.301992.00234.40997.701993.00324.58324.581994.00422.18422.181995.00523.002195.701996.00684.142647.161997.00667.392993.001998.00796.903118.101999.00883.903326.80.001012.203691.88.001174.303983.00.001348.004140.94一元線性回歸舉例2第19頁結(jié)果解析模型匯總b模型RR方調(diào)整R方標(biāo)準(zhǔn)預(yù)計誤差Durbin-Watson1.948a.898.891474.879691.147a.預(yù)測變量:(常量),x。b.因變量:y從下述各表結(jié)果來看,不難得出回歸模型顯著性較高。第20頁殘差分析原因:可能一些與因變量相關(guān)原因沒有引入回歸方程或回歸模型不適當(dāng)。但觀察左圖所表示標(biāo)準(zhǔn)化殘差P-P圖,能夠發(fā)覺,各觀察散點不是均勻地分布在對角線上,據(jù)此能夠初步判斷殘差不服從正態(tài)分布。右圖為服從正態(tài)分布殘差圖例;另外由模型匯總表得DW=1.14,小于1.5,說明殘差不具備獨立性。第21頁x1X2X3X4X5X6Y44349797681520529027703166129676115921300933953692629258247481674294163202296315434141111945310560475102126171148584172028551498727112-1242400155999151117447362628191207157251179945440456584191319548092756392023245610264731017244530111529311132566107810284572666171068782187276600979871128266480676562131219627938264410811044656329916818845054100501115205335535560801704596153796519363060108104178273483837871118233617741256616426560589121718828338864308110101763513444657914336671345689162493883087130207471733080922044495769725420034061355513015229229454713131236888210581209268408805561111197461828854147225多元線性回歸分析現(xiàn)有一組數(shù)據(jù)如右表,其中y為因變量,x1~x6為自變量,請用表中數(shù)據(jù)做回歸分析。第22頁多元線性回歸分析1)準(zhǔn)備分析數(shù)據(jù)將數(shù)據(jù)導(dǎo)入到spss2)開啟線性回歸過程單擊SPSS主菜單“分析”下“回歸”中“線性”項,將打開以下列圖所表示線性回歸過程窗口。在“方法”框中選擇“進入”選項,表示所選自變量全部進入回歸模型,選“逐步”軟件將據(jù)情況自動剔除部分變量。第23頁線性回歸模型確實定分別繪制各自變量與因變量散點圖(這里只繪制y與x1散點圖)。從散點圖可得出y與各自變量存在線性關(guān)系,所以選擇線性回歸模型進行回歸分析。多元線性回歸分析從各變量和因變量y散點圖來看,x1,x3,x5和因變量y都有顯著線性關(guān)系,x2與x4因變量y相關(guān)不太顯著。因而深入做數(shù)據(jù)相關(guān)陣分析。(假如相關(guān)檢驗沒經(jīng)過則可用剔除變量等方法進行處理)如有個別變量不符合則可敘述以下:第24頁多元線性回歸分析3)設(shè)置分析變量設(shè)置因變量:

y設(shè)置自變量:x1、x2、x3、x4、x5、x6選擇方法:進入其它為默認設(shè)置第25頁多元線性回歸分析4)設(shè)置輸出統(tǒng)計量單擊“統(tǒng)計量”按鈕,將打開如圖2-3所表示對話框。該對話框用于設(shè)置相關(guān)參數(shù)。第26頁多元線性回歸分析5)設(shè)置輸出統(tǒng)計量單擊“繪制”按鈕,將打開如圖所表示對話框。該對話框用于設(shè)置相關(guān)參數(shù)。第27頁多元線性回歸分析6)設(shè)置輸出統(tǒng)計量單擊“選項”按鈕,將打開如圖所表示對話框。該對話框用于設(shè)置相關(guān)參數(shù)。7)提交執(zhí)行在主對話框里單擊“OK”,提交執(zhí)行,結(jié)果將顯示在輸出窗口中。第28頁由系數(shù)表得變量x6容差=0.003,遠小于0.1,可斷定它與其它自變量存在嚴(yán)重共線性,故剔除自變量x6后,再進行回歸。系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B95.0%置信區(qū)間共線性統(tǒng)計量B標(biāo)準(zhǔn)誤差試用版下限上限容差VIF1(常量)25.99221.530

1.207.236-17.81169.794

x1-.5141.498-.115-.343.734-3.5612.533.01374.911x2.0341.434.008.024.981-2.8822.951.01473.409x3.0061.499.001.004.997-3.0433.055.01952.766x42.9951.063.1122.818.008.8325.158.9451.059x5-1.262.904-.055-1.396.172-3.101.577.9531.049x62.1581.4641.0501.474.150-.8215.138.003337.326a.因變量:y多元線性回歸分析共線性分析及模型修正第29頁由系數(shù)表得自變量容差都大于0.1,不存在嚴(yán)重共線性問題。但常數(shù)項和變量x5t檢驗概率分別為0.136和0.150,大于顯著性水平0.05,可斷定它們與因變量之間線性關(guān)系不顯著,故剔除常數(shù)項和自變量x5后,再進行回歸。系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B95.0%置信區(qū)間共線性統(tǒng)計量B標(biāo)準(zhǔn)誤差試用版下限上限容差VIF1(常量)32.66321.408

1.526.136-10.84576.170

x11.673.207.3758.071.0001.2522.094.7211.387x22.129.189.49411.240.0001.7442.514.8071.239x32.188.236.4119.260.0001.7082.668.7891.268x42.8301.075.1062.632.013.6455.015.9551.047x5-1.352.917-.059-1.474.150-3.216.512.9571.044a.因變量:y多元線性回歸分析回歸系數(shù)t檢驗及模型修正第30頁多元線性回歸分析

從模型匯總表結(jié)果來看,修正后回歸可決系數(shù)和調(diào)整可決系數(shù)分別為0.996和0.996,即因變量y99.6%以上變動都能夠被該模型所解釋,擬和優(yōu)度非常高。

回歸方程擬合優(yōu)度第31頁多元線性回歸分析回歸方程顯著性檢驗(方差分析F檢驗)從方差分析表結(jié)果來看,

F(0.000,4,36)=2542.398遠大于F(0.05,4,36)=

2.634,對應(yīng)t檢驗概率p=0.000,小于顯著性水平0.05,所以回歸方程整體相關(guān)性比較顯著。第32頁多元線性回歸分析回歸系數(shù)及其t檢驗解釋變量t統(tǒng)計量相伴概率p分別為0.00、0.00、0.00、0.01,都小于顯著性水平0.05,所以,在0.05顯著性水平下解釋變量全都經(jīng)過了t檢驗。故拒絕原假設(shè),各變量都與因變量有顯著線性關(guān)系。各變量容差靠近于0.1,共線性都比較弱,可認為經(jīng)過多重共線性檢驗?;貧w方程為:y=1.733x1+2.13x2+2.335x3+3.348x4

(系數(shù)表還給出了各回歸系數(shù)95%置信區(qū)間)第33頁多元線性回歸分析殘差分析1、觀察右圖所表示標(biāo)準(zhǔn)化殘差P-P圖,能夠發(fā)覺,各觀察散點均勻地分布在對角線上,據(jù)此能夠判斷殘差服從正態(tài)分布。2、由模型匯總表可得DW=1.774在1.5-2.5之間,說明殘差經(jīng)過獨立性檢驗,無自相關(guān)現(xiàn)象?!镨b于模型各項檢驗都有很高顯著性,殘差服從正態(tài)分布且相互獨立,所以該模型是一個非常好回歸模型。第34頁多元線性回歸分析模型檢驗(預(yù)測檢驗)最終,為了檢驗?zāi)P蛯嵱眯裕瑢㈩}目中最終一組自變量值代入回歸模型,利用spss軟件得到預(yù)測值為224.23,對應(yīng)95%置信區(qū)間為(221.90,226.55),而實際值225與預(yù)測值非常近似,且在預(yù)測值95%置信區(qū)間內(nèi),所以本模型經(jīng)過了最終實踐檢驗。總體來講是一個十分優(yōu)異回歸模型。說明:spss預(yù)測相關(guān)設(shè)計在保留按鈕中,詳細如右圖:Spss相關(guān)設(shè)置第35頁課后練習(xí)多元回歸在病蟲預(yù)報中應(yīng)用:某地域病蟲測報站用相關(guān)系數(shù)法選取了以下4個預(yù)報因子;x1為最多連續(xù)10天誘蛾量(只);x2為4月上、中旬累計落卵量(塊);x3為4月中旬降水量(毫米),x4為4月中旬雨日(天);預(yù)報一代粘蟲幼蟲發(fā)生量y(只/m2)。相關(guān)數(shù)據(jù)如右表。年份x1蛾量

x2卵量

x3降水量

x4雨日

y幼蟲密度

196010221124.321019613004400.1141962699677.5191963187667517.1755196543801.921196642220003196780651011.832819761152400.6271971718146018.4445197280363013.4326197357228013.2416197426433042.2319197519816571.852319764611407.5528197776964044.73441978255650011第36頁序號年份國民收入工業(yè)總產(chǎn)值農(nóng)業(yè)總產(chǎn)值總?cè)丝诠潭ㄙY產(chǎn)投資財政收入1197836451745102696259550113221979406319141270975425641146319804546219213729870556811604198148902256156010007296111765198253312383177710165412001212619835986264619781030081369

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論