




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
4.3統(tǒng)計(jì)模型檢驗(yàn)與評(píng)價(jià)
基于數(shù)據(jù)用統(tǒng)計(jì)方法建立經(jīng)驗(yàn)回歸模型,做了以下工作:一、模型檢驗(yàn)的必要性
1)借助于數(shù)據(jù)散布圖的直觀形象,
選擇一個(gè)函數(shù)來(lái)近似變量之間的相關(guān)關(guān)系;
2)用最小二乘法求經(jīng)驗(yàn)?zāi)P椭袇?shù)的最佳估計(jì).
問(wèn)題:如何評(píng)價(jià)此建模方法?
分析:若兩個(gè)隨機(jī)變量X、Y間存在相關(guān)關(guān)系,設(shè)其回歸函數(shù)為
y=μ(x).
客觀存在相當(dāng)于做假設(shè),令
這種假設(shè)主觀性太強(qiáng),是否合理必須經(jīng)過(guò)檢驗(yàn).
選擇一個(gè)函數(shù)
f(x)
作為y=μ(x)的估計(jì)函數(shù).
主觀設(shè)定續(xù)例1.7.5
p141非線性交調(diào)的頻率設(shè)計(jì)(1993全國(guó)大學(xué)生數(shù)學(xué)模型聯(lián)賽題).得到系統(tǒng)輸入輸出的兩個(gè)經(jīng)驗(yàn)關(guān)系式為
考慮到輸入輸出關(guān)系的物理背景(這一點(diǎn)在處理實(shí)際問(wèn)題時(shí)尤需重視)可以判斷第二式更為合理.需對(duì)兩個(gè)不同模型進(jìn)行評(píng)價(jià)和合理性檢驗(yàn).
一般更需要用一定的方法對(duì)模型進(jìn)行檢驗(yàn)和評(píng)價(jià),選擇更“合理”的模型.
本節(jié)主要介紹多元線性回歸模型的評(píng)價(jià)和檢驗(yàn)方法.
選擇下線性回歸模型描述因變量Y與自變量X1,X2,...XP的關(guān)系有以下問(wèn)題值得思考:1)因變量Y與可控變量X1,X2,...XP是否確有線性相關(guān)關(guān)系?是否顯著?
2)是否所有回歸系數(shù)都不為零?3)回歸方程中,設(shè)定的可控變量的個(gè)數(shù)及相應(yīng)變量是否合理?回歸系數(shù)的顯著性檢驗(yàn)回歸方程的顯著性檢驗(yàn)“最優(yōu)”回歸方程的選擇
二、
回歸方程的顯著性檢驗(yàn)根據(jù)數(shù)據(jù)建立線性經(jīng)驗(yàn)數(shù)學(xué)模型
形式地估計(jì)回歸系數(shù)并建立經(jīng)驗(yàn)線性回歸方程無(wú)實(shí)際意義.問(wèn)題:
1.變量之間是否存在線性相關(guān)關(guān)系?
2.上述方程對(duì)樣本數(shù)據(jù)的代表程度如何?
身高h(yuǎn)和體重m無(wú)明顯的線性相關(guān)關(guān)系.模型對(duì)數(shù)據(jù)的代表程度不夠需做兩方面的檢驗(yàn)工作:
1.評(píng)價(jià)方程對(duì)樣本數(shù)據(jù)的代表程度;
2.檢驗(yàn)變量之間的線性關(guān)系是否顯著.
以分析一元線性回歸模型入手.1.線性關(guān)系檢驗(yàn)1)相關(guān)系數(shù)檢驗(yàn)法2.方差分析法已學(xué)一元經(jīng)驗(yàn)線性回歸模型取定可控變量X的一組值x1,x2,…,xN,對(duì)Y做獨(dú)立n次觀察(試驗(yàn)),其觀察值為記作為yi,(i=1,2,…,N)的估計(jì)值.
1)自變量X的不同取值致使因變量Y產(chǎn)生的變化;2)其它因素(包括試驗(yàn)誤差)的影響.關(guān)心哪一個(gè)方面的影響占主導(dǎo).描述了觀察值相對(duì)數(shù)據(jù)平均值的離散程度.總偏差平方和分解總偏差平方和
回歸平方和
反映在線性回歸方程中由自變量X值的變化致使因變量Y變化的差異程度.殘差平方和
反映試驗(yàn)誤差和其它因素對(duì)試驗(yàn)結(jié)果的影響程度.
對(duì)于正態(tài)線性回歸模型若滿足回歸假定.即對(duì)X的不同取值,獨(dú)立試驗(yàn)結(jié)果的殘量
回歸平方和QR表征了自變量X的重要程度1)
相互獨(dú)立;2)具有相同分布:~N(0,σ2).相應(yīng)統(tǒng)計(jì)量并且相互獨(dú)立.檢驗(yàn)假設(shè)若H0成立,則由F分布定理知統(tǒng)計(jì)量
若X與Y之間存在線性相關(guān)關(guān)系,回歸方程中應(yīng)有b≠0.QR的值越大,統(tǒng)計(jì)量F的值越大,說(shuō)明X對(duì)Y的影響程度越高
.給定的顯著性水平α,H0:b=0的拒絕域?yàn)槠渲?/p>
若拒絕H0,稱線性回歸方程是顯著的,或稱X與Y的線性相關(guān)關(guān)系顯著.類(lèi)似地,檢驗(yàn)多元(經(jīng)驗(yàn))線性回歸方程線性關(guān)系是否顯著,需檢驗(yàn)
若H0成立,即有多元線性回歸模型中β的每一分量均為零,則Y與之間無(wú)顯著的線性相關(guān)關(guān)系.仍將總偏差平方和分解為若H0成立,統(tǒng)計(jì)量若算得F的統(tǒng)計(jì)值f使在顯著性水平下,可認(rèn)為方程有顯著意義.續(xù)例1.7.5非線性交調(diào)的頻率設(shè)計(jì)(1993年全國(guó)大學(xué)生數(shù)學(xué)模型聯(lián)賽題).進(jìn)行檢驗(yàn)有
對(duì)經(jīng)驗(yàn)回歸方程表明所建立的經(jīng)驗(yàn)輸入輸出關(guān)系式是顯著的.
三、
回歸系數(shù)的顯著性檢驗(yàn)
通過(guò)了回歸方程的顯著性檢驗(yàn),說(shuō)明因變量和可控變量之間的回歸關(guān)系顯著,并且回歸函數(shù)的形式明顯.思考1)得到回歸系數(shù)不全為零的結(jié)論,能否說(shuō)明所有的回歸系數(shù)都不為零;2)每個(gè)可控變量對(duì)Y的影響程度是否同等重要.在例1.7.5考慮進(jìn)非零輸入項(xiàng)的經(jīng)驗(yàn)回歸模型經(jīng)檢驗(yàn)也是顯著的.
應(yīng)建立只包含對(duì)因變量影響顯著的自變量的回歸方程.
回歸系數(shù)的大小反映了各個(gè)變量因素對(duì)Y的影響程度.
若變量Xj對(duì)Y的線性影響不顯著,則正態(tài)線性回歸模型中應(yīng)有βj等于零或很接近于零.有必要對(duì)各回歸系數(shù)本身進(jìn)行檢驗(yàn).檢驗(yàn)Xj對(duì)Y有無(wú)顯著的線性影響,相當(dāng)于檢驗(yàn)假設(shè)
正態(tài)多元線性回歸模型的最小二乘估計(jì)向量b的每一分量bj都服從正態(tài)分布,且E(bj)=βj,,(j=1,2,…,P),其中cjj是相關(guān)矩陣的第j個(gè)對(duì)角元素,故若成立,則從而又因bj與殘差平方和QE相互獨(dú)立,由F定理有
對(duì)給定顯著性水平α,由樣本值算得Fj的統(tǒng)計(jì)值fj,
檢驗(yàn)準(zhǔn)則為若,則拒絕H0,可以認(rèn)為Xj對(duì)Y的線性影響顯著.四、“最優(yōu)”回歸模型的選擇
應(yīng)用中總希望用“最優(yōu)”的線性回歸方程來(lái)描述變量間的線性相關(guān)關(guān)系.最優(yōu)思想:1)模型中應(yīng)包含所有對(duì)因變量Y有顯著影響的自變量;2)方程中所包含的自變量個(gè)數(shù)盡可能少.
通過(guò)回歸系數(shù)顯著性檢驗(yàn),已判斷出原回歸方程若中不顯著的自變量問(wèn)題:能否從方程中將它們其剔除了之?
如檢驗(yàn)出xi的線性相關(guān)性不顯著,去掉xi后的方程是否為“最優(yōu)”回歸方程?答案:否定!
回歸系數(shù)的最小二乘估計(jì)b0,b1,…,bP相互之間存在相關(guān)性.從原經(jīng)驗(yàn)方程剔除一個(gè)可控變量時(shí),其它自變量的回歸系數(shù)就會(huì)發(fā)生改變.
應(yīng)從余下的P-1個(gè)自變量
著手,重新估計(jì)出回歸系數(shù),得到新的回歸方程一般引進(jìn)偏回歸平方和的概念總偏差平方和分解式回歸平方和反映了所有自變量對(duì)Y波動(dòng)的總貢獻(xiàn).
在模型中去掉某個(gè)自變量,回歸平方和值將減小,且減小的數(shù)值越大,說(shuō)明該自變量在回歸模型中的作用越大.為自變量xi的偏回歸平方和
.反映xi對(duì)Y的波動(dòng)的貢獻(xiàn)其中是由自變量中x1,x2,,…,xP掉xi所得的回歸平方和.可用自變量的偏回歸平方和的大小來(lái)衡量在一組自變量中的重要程度.將各自變量的偏回歸平方和作為評(píng)價(jià)指標(biāo),按一定的優(yōu)化原則剔除或引進(jìn)自變量,
選擇“最優(yōu)”回歸模型.1)淘汰法(向后法、下降法)2)納新法(向前法、上升法)常用方法有:3)逐步回歸法(吐故納新法)以及前兩種方法的綜合與改進(jìn)五、
數(shù)據(jù)殘差圖分析
是檢驗(yàn)回歸方程擬合優(yōu)度的一個(gè)簡(jiǎn)單有效的方法.數(shù)據(jù)殘差圖分析原理一元線性回歸模型獨(dú)立試驗(yàn)結(jié)果:滿足回歸假定1)
相互獨(dú)立;2)具有相同分布:~N(0,σ2).設(shè)Y對(duì)應(yīng)于的N個(gè)觀測(cè)值為作為yi,(i=1,2,…,n)的估計(jì)值,其中分別為a和b的估計(jì).稱為標(biāo)準(zhǔn)化殘差.定義
稱為殘差注1
ei,i=1,2,…,n是
,i=1,2,…,N的樣本值.
注2
可用作為σ的估計(jì),仍記
由于,i=1,2,…,n相互獨(dú)立,并且~N(0,σ2)有95.45%的把握e*的值在(一2,2)區(qū)間內(nèi)變動(dòng).以e*為縱坐標(biāo),xi為橫坐標(biāo),將數(shù)據(jù)(xi,e*),i=1,2,…,n繪在平面圖內(nèi),所得圖形稱為標(biāo)準(zhǔn)化殘差圖.
分析數(shù)據(jù)殘差圖,若數(shù)據(jù)點(diǎn)(xi,e*),i=1,2,…,n在(一2,2)區(qū)間內(nèi)隨機(jī)散布,說(shuō)明回歸方程的擬合是良好的.xiei*例6.5.1生產(chǎn)費(fèi)用與產(chǎn)量擬合優(yōu)度分析
隨機(jī)抽取了某一類(lèi)企業(yè)中的10個(gè)企業(yè),調(diào)查了它們的產(chǎn)量和生產(chǎn)費(fèi)用情況,取得數(shù)據(jù)如下表:
企業(yè)編號(hào)12345678910產(chǎn)量(千個(gè))X40424855657988100120140生產(chǎn)費(fèi)用(千元)Y150140160170150162185165190185建立經(jīng)驗(yàn)回歸方程為
計(jì)算出標(biāo)準(zhǔn)化殘差(見(jiàn)P170表7.9),繪制生產(chǎn)費(fèi)用的標(biāo)準(zhǔn)化殘差圖(圖7.11).圖中標(biāo)準(zhǔn)化殘差e*在橫軸上下隨機(jī)散布,且位于(一2,2)區(qū)間內(nèi),可以認(rèn)為方程對(duì)數(shù)據(jù)的擬合是良好的.
例6.5.2
試分析講義P175圖7.10的四副標(biāo)準(zhǔn)化殘差圖.1.圖(a)全部數(shù)據(jù)都在(-2,2)區(qū)間內(nèi),且隨機(jī)散布,說(shuō)明方程對(duì)數(shù)據(jù)的擬合是良好的.2.圖(b)中有較多數(shù)據(jù)落在(-2,2)區(qū)間的外面,這說(shuō)明方程對(duì)數(shù)據(jù)的擬合不充分.可能是由于方程的形式選擇不恰當(dāng).
通過(guò)分析標(biāo)準(zhǔn)化殘差圖可以得到更多信息,可以分析出回歸方程的回歸假定的滿足情況.
*1圖(c)中殘差出現(xiàn)系統(tǒng)變動(dòng)的趨勢(shì);
表明關(guān)于,i=1,2,…,n
的等方差假定不滿足;
*2圖(d)中殘差值e*,i=1,2,…,n
有相依關(guān)系;說(shuō)明關(guān)于,i=1,2,…,n的獨(dú)立性假定不滿足.
對(duì)殘差圖做進(jìn)一步分析:是評(píng)價(jià)回歸方程擬合優(yōu)度的一個(gè)指標(biāo).
可證明
0≤r2≤1且
r2的值越大說(shuō)明方程對(duì)數(shù)據(jù)的擬合度越高.?2)計(jì)算測(cè)定系數(shù)(確定系數(shù)、
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年河北保定曲陽(yáng)縣公開(kāi)選聘職教中心教師18名模擬試卷附答案詳解(典型題)
- 2025內(nèi)蒙古氣象部門(mén)招聘70人考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解(典優(yōu))
- 2025廣東韶關(guān)市翁源縣畜牧獸醫(yī)水產(chǎn)局補(bǔ)招錄特聘動(dòng)物防疫專員1人考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解參考
- 2025年宜昌市點(diǎn)軍區(qū)公開(kāi)招聘6名社區(qū)專職工作人員(網(wǎng)格員)模擬試卷有完整答案詳解
- 吉林省長(zhǎng)春市2024-2025學(xué)年高三下學(xué)期質(zhì)量監(jiān)測(cè)(二)地理試題(解析版)
- 2025廣東佛岡縣水頭鎮(zhèn)選拔儲(chǔ)備村(社區(qū))“兩委”后備人員考前自測(cè)高頻考點(diǎn)模擬試題及一套完整答案詳解
- 湖南省名校聯(lián)盟2024-2025學(xué)年高一上學(xué)期入學(xué)聯(lián)考地理地理試題(解析版)
- 企業(yè)財(cái)務(wù)流程合規(guī)操作保證承諾書(shū)3篇
- 2025年金華東陽(yáng)市人民醫(yī)院招聘編外人員8人考前自測(cè)高頻考點(diǎn)模擬試題參考答案詳解
- 租船經(jīng)紀(jì)人課件
- 內(nèi)部控制活動(dòng)方案
- 腰椎病護(hù)理疑難病例討論講課件
- PCI術(shù)后護(hù)理課件
- JG/T 347-2012聚碳酸酯(PC)實(shí)心板
- 博弈論視角下的水資源配置優(yōu)化策略與實(shí)踐探索
- DB32/T 3722-2020高標(biāo)準(zhǔn)農(nóng)田建設(shè)項(xiàng)目可行性研究報(bào)告編制規(guī)程
- 耳石癥教學(xué)課件
- 學(xué)生心理健康一生一策檔案表
- 《淡水生態(tài)系統(tǒng)之謎》課件
- 王之渙《登鸛雀樓》課件2
- 北師大版小學(xué)五年級(jí)數(shù)學(xué)下冊(cè)教案全冊(cè)
評(píng)論
0/150
提交評(píng)論