SAS第三十三課逐步回歸分析_第1頁
SAS第三十三課逐步回歸分析_第2頁
SAS第三十三課逐步回歸分析_第3頁
SAS第三十三課逐步回歸分析_第4頁
SAS第三十三課逐步回歸分析_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

#/12程序的輸出包括所有只含一個變量的6種回歸,含2個變量的15種回歸,……??偣灿?3種不同形式的回歸模型。例如,含2個自變量按R2第二個大值選擇回歸模型為,R2=0.76142381,擬合的回歸模型為oxygen=93?0888—O?0735mnp“he—3?1402runtime若對每種變量個數(shù),只要保留R2最大的兩種情況,可在model語句中加入選項best=2,即提交procregdata二fitness;modeloxygen=ageweightrstpulsemaxpulserunpulseruntime/selection二rsquarebbest=2;run;這N二:31RegressionModelsforDependentVariable:OXYGENNumberinModel11R-square0.743380100.15838344ParameterRUNTIME-3.3106EstimatesIntercept82.421882.4582AGEWEIGHTRSTPULSEMAXPULSERUNPULSE-0.206820.7642469388.4623-0.1504-3.204020.7614238193.0888-0.0735-3.140230.81109446111.7-0.2564-0.1309-2.825430.8099884480.90080.3542-0.3751-2.970240.8368181598.1479-0.19770.2705-0.3481-2.7676表33.4只保留R2最大兩種情況的逐步回歸分析結果通過上面的逐步回歸分析,我們已經(jīng)得到回歸模型的自變量個數(shù)確定時的最優(yōu)子集或次優(yōu)子集,但問題是我們到底應該選擇幾個自變量的回歸模型呢?如上表33.4中的3個自變量、4個自變量、5個自變量、6個自變量的回歸模型中哪一個模型呢?一種最簡便確定回歸模型的自變量個數(shù)的方法是Mallows的Cp方法。確定好模型的自變量個數(shù)后,根據(jù)上表33.4就很容易確定在這個固定自變量數(shù)下,最優(yōu)的自變量組合和相應的參數(shù)值估計。以下的程序是對所有可能的回歸按C由小到大進行排序并保留其前5種,并繪制C圖。PPgoptionsreset二globalgunit=pctcback二whiteborderhtitle=6htext=3ftext二swissbcolors=(back);

title'CpplotwithReferenceLines';procregdata二fitness;modeloxygen=ageweightrstpulsemaxpulserunpulseruntime

/selection二cpadjrsqbest=5;plotcp.*np./chocking二redcmallows二bluevaxis=0to15by2haxis=0to8by1;run;Model語句中的selection=cp選項請求計算Mallows的C統(tǒng)計量。選項adjrsq表示要顯示每種回歸模型的統(tǒng)計量Adj-R2。選項best=5表示保留Cp值最小的前5種。plot語句中的cp.*np.表達式(注意統(tǒng)計量關鍵字母后的小圓點)表示Y軸為C值X軸為P值(P值包括截距項)。plot語句的選項chocking=red,表示畫Cp=2P_P鐘紅色參考虛線,其中P是子模型中含截距的參數(shù)個數(shù),Pfull是全模型中不含截距的參數(shù)個數(shù)。Hoching(1976)建議選擇滿足CW2P—P且CWP的模型。plot語句的選項cmallows=blue,表示畫C=P藍色參考實線,pfullpp其中P是子模型中含截距的參數(shù)個數(shù)。Mallows(1973)建議考慮所有滿足C較小且接近P的模型。這一程序的輸出結果見表33.5和見圖33-1所示。"表33.5按C由小到大進行排序并保留其前5種逐步回歸分析結果pc(p)N=31R-squareRegressionModelsforDependentVariable:OXYGENInAdjustedR-squareVariablesinModel4.766090.8368181540.81171325AGEMAXPULSERUNPULSERUNTIME5.000210.8480018150.81760218AGEWEIGHTMAXPULSERUNPULSERUNTIME6.752590.8369035950.80428431AGERSTPULSEMAXPULSERUNPULSERUNTIME6.827800.81109446―3—0.79010496AGERUNPULSERUNTIMECpplotwithReferenceLinesCQtYGEN=WQF4-C.2S9AJGE-0.0724WBGHT-OjOOCffinSTPULSE+GJ047MAXPULSE-0.3732RUNPULSERUNTIMEP31RsqRtMSE2.3321CQtYGEN=WQF4-C.2S9AJGE-0.0724WBGHT-OjOOCffinSTPULSE+GJ047MAXPULSE-0.3732RUNPULSERUNTIMEP31RsqRtMSE2.3321CP-PPlot十十十CP*PCP-PrCP2P—(Pforftillmod?I)+1圖33T帶有Mallows和Hocking參考線的Cp散點圖

從輸出結果可看出,以Mallows的建議為標準,age,maxpulse,runpulse和runtime四個變量進人回歸模型時C最小(4.76609),且與P=4+l=5最接近,因為5—4.76609<6—5.00021,所以應該選擇Cp=4.76609的模型。以Hocking的建議為標準,Cp=4.76609的模型不滿足要求,因為4.76609>2X5—6=4。而C=5.00021的模型滿足要求,因為5.00021<2X6—6=6且5.00021V6。而Cp=6.75259的模型:無論以Mallows的建議還是以Hocking的建議都不滿足要求。其實我們不必具體計算,只要看圖33-1中,表示Cp值大小位置的“+”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論