




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第10章含定性變量的回歸模型10.1 一個學生使用含有季節(jié)定性自變量的回歸模型,對春夏秋冬四個季節(jié)引入4個0-1型自變量,用SPS欹件計算的結(jié)果中總是自動刪除了其中的一個自變量,他為此感到困惑不解。出現(xiàn)這種情況的原因是什么?答:假如這個含有季節(jié)定性自變量的回歸模型為:Yt-0.一Xkt,口貨.一D2tD3t其中含有k個定量變量,記為X。對春夏秋冬四個季節(jié)引入4個0-1型自變量,記為D,只取了6個觀測值,其中春季與夏季取了兩次,秋、冬各取到一次觀測值,則樣本設(shè)計矩陣為:(X,D),彳Xn1X121X131X141X15X16Xk11000Xk20100Xk30010Xk40001Xk50100X
2、k61000顯然,(X,D)中的第1列可表示成后4列的線性組合,從而(X,D)不滿秩,參數(shù)無法唯一求出。這就是所謂的虛擬變量陷井”,應避免。當某自變量為對其余p-1個自變量的復判定系數(shù)Rj超過一定界限時,SPSS2一、軟件將拒絕這個自變量xj進入回歸模型。稱Tolj=1-Rj為自變量xj的容忍度(Tolerance),SPSSB件的默認容忍度為0.0001。也就是說,當R2>0.9999時,自變量Xj將被自動拒絕在回歸方程之外,除非我們修改容忍度的默認值而在這個模型中出現(xiàn)了完全共線性,所以SPSSt件計算的結(jié)果中總是自動刪除了其中的一個定性自變量。10.2 對自變量中含有定性變量的問題,
3、為什么不對同一屬性分別建立回歸模型,而采取設(shè)虛擬變量的方法建立回歸模型?答:原因有兩個,以例10.1說明。一是因為模型假設(shè)對每類家庭具有相同的斜率和誤差方差,把兩類家庭放在一起可以對公共斜率做出最佳估計;二是對于其他統(tǒng)計推斷,用一個帶有虛擬變量的回歸模型來進行也會更加準確,這是均方誤差的自由度更多10.3 研究者想研究采取某項保險革新措施的速度y對保險公司的規(guī)模xi和保險公司類型的關(guān)系(參見參考文獻【3】)。因變量的計量是第一個公司采納這項革新和給定公司采納這項革新在時間上先后間隔的月數(shù)。第一個自變量公司的規(guī)模是數(shù)量型的,用公司的總資產(chǎn)額(百萬美元)來計量;第二個自變量公司是定性變量,由兩種類
4、型構(gòu)成,即股份公司和互助公司。數(shù)據(jù)資料見表10.8,試建立y對公司規(guī)模和公司類型的回歸表10.8iyX1公司類型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份解:對定型變量“公司類型”進行數(shù)量化處理:引入虛擬變量X2:公司類型為“互助”時,x2=1,為“股份”時,x2=0則表9.5中數(shù)據(jù)轉(zhuǎn)換成以下數(shù)據(jù):iyX1公司
5、類型1171511226921321175143031152210416027717122101819120194290110162381112816401215272013112950143868015318501621224017201660181330501930124020142460建立回歸力程y=b0+b1X1+b2X2+e用SPS欹件作線性回歸,得到輸出結(jié)果如下:ModelSummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.946a.895.8833.221a.Predictors:(Constant),公司類型,
6、x1R僉驗:擬合優(yōu)度R2=0.883,接近1,說明回歸擬合的效果較好ANOVAModelSumofSquaresdfMeanSquareFSig.1Regression1504.4132752.20772.497.000aResidual176.3871710.376Total1680.80019a.Predictors:(Constant),公司類型,x1b.DependentVariable:yF檢驗:F值=72.497,Sig.值為0,說明回歸方程通過F檢驗ModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.E
7、rrorBeta1(Constant)41.9302.01020.859.000x1-.102.009-.911-11.443.000公司類型-8.0551.459-.439-5.521.000a-DependentVariable:yT檢驗:回歸系數(shù)通過t檢驗,回歸方程為:y=41.930-0.102x1-8.055x2說明:若引入虛擬變量X2,當公司類型為“互助”時,x2=0,為“股份”時,x2=1則回歸方程為:y=33.8740.102xi+8.055x2結(jié)果分析:(1)股份制公司采取保險革新措施的積極性比互助型公司高,原因可能在于股份制公司建立在共同承擔風險上,所以更愿意革新;(2)公
8、司規(guī)模越大,采取保險革新措施的傾向越大:大規(guī)模公司的保險制度的更新對公司的影響程度比小規(guī)模公司大,因此大規(guī)模公司更傾向于比較更新措施和現(xiàn)有政策帶來的效益,最終表現(xiàn)在采納革新措施的時間間隔較短。.表10.9的數(shù)據(jù)是我國歷年鐵路里程數(shù)據(jù),根據(jù)散點圖觀察在某時間點有折點,用折線回歸擬合這個數(shù)據(jù)。解:由散點圖9(見下圖)可看出在1995年(t=16)有折點,考慮由兩段構(gòu)成的分段線性回歸,這可以通過引入一個0-1型虛擬自變量實現(xiàn)。由散點圖可知該折點為t=16,則引入虛擬自變量x,0,t<16上-16,t>16由SPSS俞出的調(diào)整后的決定系數(shù)R2=0.980,說明擬合優(yōu)度較好。由輸出的系數(shù)表可
9、以得出回歸方程為:?=5.183+0.055t+0.106x由SPSS俞出方程分析表可知,F(xiàn)值為594.524,且P值約為零,說明回歸方程非常顯著;系數(shù)表中回歸參數(shù)對應的t檢驗P值都約等于零,說明回歸參數(shù)均通過了顯著性檢驗。因此,折線方程成立。7.50-G.50-5.50散點圖方差分析表ANOVAModelSumofSquaresdfMeanSquareFSig.1Regression11.11325.557594.524.000aResidual.20622.009Total11.31924Predictors:(Constant),x,tDependentVariable:y系數(shù)表Coef
10、ficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)5.183.049106.303.000t.055.005.58911.859.000x.106.012.4509.065.000a.DependentVariable:y某省統(tǒng)計局1990年9月在全省范圍內(nèi)進行了一次公眾安全感問卷調(diào)查,參考文獻【10】選取了調(diào)查表中的一個問題進行分析。本題對其中的數(shù)據(jù)做了適當?shù)暮喜?。?391人填寫的問卷設(shè)計:“一人在家是否害怕生人來”。因變量y=1表示害怕,y=2表示不害
11、怕。2個自變量:x1是年齡,x2是文化程度各變量的取值含義如表10.10所示表10.10是否害怕y年齡x1文化程度x2害怕1不害怕01628歲222945歲374660歲5361歲以上68文官0小學1中學2中專以上3現(xiàn)在的問題是:公民一人在家害怕生人來這個事件,與公民的年齡x1、文化程度x2有沒有關(guān)系呢?調(diào)查數(shù)據(jù)見表10.11。表10.11序號XiX2niy=1y=0pi12203090.12500222111380.2916732223891462430.3756442238326570.3154853704310.700006371271890.6607173724871962910.40
12、266837310327760.264429535309450.45000105316330.5000011532188731150.38889126834718290.38542136802020.166671468110370.3181815682187110.394741634040.10000其中,pi是根據(jù)(10.44)式計算的。(1)把公民的年齡x1、文化程度x2作為數(shù)值型變量,建立y對x1、x2的logistic回歸。(2)把公民的年齡x1、文化程度x2作為定性型變量,用0-1變量將其數(shù)量化,建立y對公民的年齡和文化程度的logistic回歸。(3)你對回歸的效果是否滿意,你認為
13、主要的問題是什么?解:(1)先對Pi進行邏輯變換,令pj=ln(),則1-PipH:iXi,:2X2-;i直接用SPSS®Ty與x1、x2的logistic回歸,輸出結(jié)果如下:ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression.5622.281.386.687aResidual9.45913.728Total10.02015Coefficientsa.Predictors:(Constant),x2,x1b.DependentVariable:ppiModelUnstandardizedCoefficientsStandardize
14、dCoefficientstSig.BStd.ErrorBeta1(Constant)-.144.662-.218.831x1-.006.012-.137-.510.619x2-.136.191-.193-.715.487a.DependentVariable:ppia由SPSS俞出系數(shù)表結(jié)果得到回歸方程:?=-0.144-0.006x1-0.136x2則還原后logistic回歸方程為:?=exp(-0.144-0.006x1-0.136x2)1exp(-0.144-0.006xi-0.136x2)由方差分析表知F值=0.386,P值=0.687,大于5%說明回歸方程不顯著;由系數(shù)表知回歸參
15、數(shù)的t檢驗均沒有通過,因為P值都大于5%說明回歸參數(shù)未通過顯著性檢驗。由于logistic回歸模型存在異方差,所以采用加權(quán)最小二乘法重新擬合,權(quán)重:=npi(1一r)spsSj出結(jié)果如下:ANOVAb,cModelSumofSquaresdfMeanSquareFSig.1Regression8.39324.1974.304.037aResidual12.67613.975Total21.06915a.Predictors:(Constant),x2,x1b.DependentVariable:ppic.WeightedLeastSquaresRegression-WeightedbywiMo
16、delUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant).146.309.472.645x1.002.005.086.398.697x2-.331.116-.617-2.858.013Coefficientsa,bDependentVariable:ppiWeightedLeastSquaresRegression-Weightedbywi由輸出結(jié)果得到回歸方程:?=0.1460.002x1-0.331x2exp(0.1460.002xi-0.331x2)還原后的回歸萬程:。=1-1e
17、xp(0.1460.002xi-0.331x2)由方差分析表結(jié)果知:F值=4.304,P值=0.037,小于5%說明回歸方程顯著;由系數(shù)表知人對應的回歸系數(shù)相應的P值=0.697,大于5%說明人對應的回歸系數(shù)沒有通過檢驗,不顯著;x2對應的回歸系數(shù)相應的P值=0.013,小于5%說明x2對應的回歸系數(shù)通過檢顯著性驗,且該回歸系數(shù)為-0.331,表明文化程度越高越不害怕。(2)把公民的年齡x1、文化程度x2作為定性型變量,引入6個0-1變量表示年齡X122x=22xl1W22Y一=Vxl237出=372,Y3753x1=53、0,X#531,知=2。也21,x2=0,“2一'#01,x2
18、=1,X23=J。涇,11)直接進行y與6個虛擬變量的未加權(quán)的logistic回歸,SPSS俞出結(jié)果如下:由方差分析表知F=2.472,P值=0.106,大于5%說明回歸方程不顯著;且除了2外,其它自變量對應的回歸系數(shù)都沒通過檢驗ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression4.74341.1862.472.106aResidual5.27711.480Total10.02015a.Predictors:(Constant),x13,x2,x12,x11b.DependentVariable:ppiCoefficientsaModelUn
19、standardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)-1.044.417-2.505.029x2-.136.155-.193-.881.397x11.220.490.120.449.662x121.273.490.6972.600.025x13.969.490.5301.979.073a.DependentVariable:ppi下面通過后退法選擇變量對上述模型改進SPSS俞出結(jié)果如下表:ANOVAModelSumofSquaresdfMeanSquareFSig.1RegressionRe
20、sidualTotal4.7435.27710.020411151.186.4802.472.106a2RegressionResidualTotal4.6475.37410.020312151.549.4483.459.051b3RegressionResidualTotal4.2745.74610.020213152.137.4424.835.027cPredictors:(Constant),x13,x2,x12,x11Predictors:(Constant),x13,x2,x12Predictors:(Constant),x13,x12DependentVariable:ppiMod
21、elUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)-1.044.417-2.505.029x2-.136.155-.193-.881.397x11.220.490.120.449.662x121.273.490.6972.600.025x13.969.490.5301.979.0732(Constant)-.934.326-2.865.014x2-.136.150-.193-.912.380x121.163.410.6362.838.015x13.859.410.4702.097.
22、0583(Constant)-1.139.235-4.846.000x121.163.407.6362.857.013x13.859.407.4702.110.055a-DependentVariable:ppi后退法的過程中剔除了XiX2,留下了Xi2,Xi3,但是X13對應的回歸系數(shù)未通過檢驗,將其剔除,最后留下了X12;而且回歸方程顯著,2)加權(quán)回歸:用后退法選擇變量,由輸出結(jié)果(如下)可知最后只留下了X2ModelSumofSquaresdfMeanSquareFSig.1RegressionResidualTotal9.97911.09021.069411152.4951.0082.
23、475.106a2RegressionResidualTotal9.52611.54321.069312153.175.9623.301.058b3RegressionResidualTotal8.87012.19921.069213154.435.9384.726.029c4RegressionResidualTotal8.23812.83121.069114158.238.9168.989.010dANOVAe,fPredictors:(Constant),x13,x2,x11,x12Predictors:(Constant),x13,x2,x12Predictors:(Constant),x2,x12Predictors:(Constant),x2DependentVariable:ppiWeightedLeastSquaresRegression-WeightedbywiModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)-.092.425-.217.832x2-.344.118-.641-2.901.014x11.263.392.49
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025電子商務公司客戶服務代表勞動合同
- 二零二五年圖書翻譯兼職合作協(xié)議
- 2025版生態(tài)環(huán)保工程勘察設(shè)計合同示范文本
- 2025版?zhèn)€人房產(chǎn)交易合同范本
- 2025版亮化工程勞務派遣合同范本版
- 2025年新型集裝箱貨物海上運輸保險合同范本
- 2025版城市公共服務設(shè)施建設(shè)項目工程總承包合作協(xié)議書
- 二零二五年定制化電池維修與技術(shù)支持服務合同
- 2025版房產(chǎn)中介居間服務合同范本
- 二零二五年度特色小鎮(zhèn)項目多方聯(lián)合開發(fā)合同
- 架梁隊箱梁出場檢驗與交接制度
- JJF(津) 01-2018 真空干燥箱校準規(guī)范
- DB11-689-2016建筑抗震加固技術(shù)規(guī)程
- 2021年濮陽市(中小學、幼兒園)教師招聘筆試試題及答案解析
- 醫(yī)院消防安全知識培訓PPT課件.pptx
- 中國嘉德北京保利等藝術(shù)品拍賣公司庫房管理制度
- 《儒林外史》試題含答案-儒林外史題目及答案
- 2022年藥品檢驗員綜合理論技能考試題庫(精選500題)
- 10KV變壓器安裝施工工藝標準[詳]
- 代理費監(jiān)理費費用計算工具(Excel)自帶公式
- 亞硝酸鹽測定評分標準
評論
0/150
提交評論