




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第十章統(tǒng)計回歸模型10.1牙膏的銷售量10.2軟件開發(fā)人員的薪金10.3酶促反應10.4投資額與國民生產(chǎn)總值和物價指數(shù)第十章統(tǒng)計回歸模型10.1牙膏的銷售量回歸模型是用統(tǒng)計分析方法建立的最常用的一類模型數(shù)學建模的基本方法機理分析測試分析通過對數(shù)據(jù)的統(tǒng)計分析,找出與數(shù)據(jù)擬合最好的模型不涉及回歸分析的數(shù)學原理和方法通過實例討論如何選擇不同類型的模型對軟件得到的結(jié)果進行分析,對模型進行改進由于客觀事物內(nèi)部規(guī)律的復雜及人們認識程度的限制,無法分析實際對象內(nèi)在的因果關(guān)系,建立合乎機理規(guī)律的數(shù)學模型。回歸模型是用統(tǒng)計分析方法建立的最常用的一類模型數(shù)學建模的基10.1牙膏的銷售量
問題建立牙膏銷售量與價格、廣告投入之間的模型預測在不同價格和廣告費用下的牙膏銷售量收集了30個銷售周期本公司牙膏銷售量、價格、廣告費用,及同期其它廠家同類牙膏的平均售價9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851銷售量(百萬支)價格差(元)廣告費用(百萬元)其它廠家價格(元)本公司價格(元)銷售周期10.1牙膏的銷售量問題建立牙膏銷售量與價格、廣告投入基本模型y~公司牙膏銷售量x1~其它廠家與本公司價格差x2~公司廣告費用x2yx1yx1,x2~解釋變量(回歸變量,自變量)y~被解釋變量(因變量)0,1
,2,3~回歸系數(shù)~隨機誤差(均值為零的正態(tài)分布隨機變量)基本模型y~公司牙膏銷售量x1~其它廠家與本公司價格差x2MATLAB統(tǒng)計工具箱
模型求解[b,bint,r,rint,stats]=regress(y,x,alpha)
輸入
x=~n4數(shù)據(jù)矩陣,第1列為全1向量alpha(置信水平,0.05)
b~的估計值bint~b的置信區(qū)間r~殘差向量y-xb
rint~r的置信區(qū)間Stats~檢驗統(tǒng)計量
R2,F,p
y~n維數(shù)據(jù)向量輸出
由數(shù)據(jù)y,x1,x2估計參數(shù)參數(shù)估計值置信區(qū)間17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.00000123MATLAB統(tǒng)計工具箱模型求解[b,bint,r,rin結(jié)果分析y的90.54%可由模型確定參數(shù)參數(shù)估計值置信區(qū)間17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.00000123F遠超過F檢驗的臨界值p遠小于=0.05
2的置信區(qū)間包含零點(右端點距零點很近)x2對因變量y的影響不太顯著x22項顯著可將x2保留在模型中模型從整體上看成立結(jié)果分析y的90.54%可由模型確定參數(shù)參數(shù)估計值置信區(qū)間銷售量預測價格差x1=其它廠家價格x3-本公司價格x4估計x3調(diào)整x4控制價格差x1=0.2元,投入廣告費x2=650萬元銷售量預測區(qū)間為[7.8230,8.7636](置信度95%)上限用作庫存管理的目標值下限用來把握公司的現(xiàn)金流若估計x3=3.9,設(shè)定x4=3.7,則可以95%的把握知道銷售額在7.83203.729(百萬元)以上控制x1通過x1,x2預測y(百萬支)銷售量預測價格差x1=其它廠家價格x3-本公司價格x4估計模型改進x1和x2對y的影響獨立
參數(shù)參數(shù)估計值置信區(qū)間17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.00000123參數(shù)參數(shù)估計值置信區(qū)間29.1133[13.701344.5252]11.1342[1.977820.2906]-7.6080[-12.6932-2.5228]0.6712[0.25381.0887]-1.4777[-2.8518-0.1037]R2=0.9209F=72.7771p=0.000030124x1和x2對y的影響有交互作用模型改進x1和x2對y的影響獨立參數(shù)參數(shù)估計值置信區(qū)間17兩模型銷售量預測比較(百萬支)區(qū)間[7.8230,8.7636]區(qū)間[7.8953,8.7592](百萬支)控制價格差x1=0.2元,投入廣告費x2=6.5百萬元預測區(qū)間長度更短略有增加兩模型銷售量預測比較(百萬支)區(qū)間[7.8230,8.76x2=6.5x1=0.2x1x1x2x2兩模型與x1,x2關(guān)系的比較x2=6.5x1=0.2x1x1x2x2兩模型與x1交互作用影響的討論價格差x1=0.1價格差x1=0.3加大廣告投入使銷售量增加(x2大于6百萬元)價格差較小時增加的速率更大x2價格優(yōu)勢會使銷售量增加價格差較小時更需要靠廣告來吸引顧客的眼球交互作用影響的討論價格差x1=0.1價格差x1=0.3完全二次多項式模型MATLAB中有命令rstool直接求解x1x2從輸出Export可得完全二次多項式模型MATLAB中有命令rstool直接求解10.2軟件開發(fā)人員的薪金資歷~從事專業(yè)工作的年數(shù);管理~1=管理人員,0=非管理人員;教育~
1=中學,2=大學,3=更高程度建立模型研究薪金與資歷、管理責任、教育程度的關(guān)系分析人事策略的合理性,作為新聘用人員薪金的參考
編號薪金資歷管理教育0113876111021160810303187011130411283102編號薪金資歷管理教育422783716124318838160244174831601451920717024619346200146名軟件開發(fā)人員的檔案資料
10.2軟件開發(fā)人員的薪金資歷~從事專業(yè)工作的年數(shù)分析與假設(shè)y~薪金,x1~資歷(年)x2=
1~管理人員,x2=
0~非管理人員1=中學2=大學3=更高資歷每加一年薪金的增長是常數(shù);管理、教育、資歷之間無交互作用
教育線性回歸模型a0,a1,…,a4是待估計的回歸系數(shù),是隨機誤差中學:x3=1,x4=0;大學:x3=0,x4=1;更高:x3=0,x4=0分析與假設(shè)y~薪金,x1~資歷(年)x2=1~管模型求解參數(shù)參數(shù)估計值置信區(qū)間a011032[1025811807]a1546[484608]a26883[62487517]a3-2994[-3826-2162]a4148[-636931]R2=0.957F=226p=0.000R2,F,p模型整體上可用資歷增加1年薪金增長546管理人員薪金多6883中學程度薪金比更高的少2994大學程度薪金比更高的多148a4置信區(qū)間包含零點,解釋不可靠!中學:x3=1,x4=0;大學:x3=0,x4=1;更高:x3=0,x4=0.x2=
1~管理,x2=
0~非管理x1~資歷(年)模型求解參數(shù)參數(shù)估計值置信區(qū)間a011032[10258殘差分析方法
結(jié)果分析殘差e與資歷x1的關(guān)系
e與管理—教育組合的關(guān)系
殘差全為正,或全為負,管理—教育組合處理不當
殘差大概分成3個水平,6種管理—教育組合混在一起,未正確反映。應在模型中增加管理x2與教育x3,x4的交互項
組合123456管理010101教育112233管理與教育的組合殘差分析方法結(jié)果分析殘差e與資歷x1的關(guān)系e與管理—教進一步的模型增加管理x2與教育x3,x4的交互項參數(shù)參數(shù)估計值置信區(qū)間a011204[1104411363]a1497[486508]a27048[68417255]a3-1727[-1939-1514]a4-348[-545–152]a5-3071[-3372-2769]a61836[15712101]R2=0.999F=554p=0.000R2,F有改進,所有回歸系數(shù)置信區(qū)間都不含零點,模型完全可用
消除了不正?,F(xiàn)象
異常數(shù)據(jù)(33號)應去掉
e~x1
e~組合進一步的模型增加管理x2與教育x3,x4的交互項參數(shù)參數(shù)估去掉異常數(shù)據(jù)后的結(jié)果參數(shù)參數(shù)估計值置信區(qū)間a011200[1113911261]a1498[494503]a27041[69627120]a3-1737[-1818-1656]a4-356[-431–281]a5-3056[-3171–2942]a61997[18942100]R2=0.9998F=36701p=0.0000e~x1
e~組合R2:0.9570.9990.9998F:226
55436701置信區(qū)間長度更短殘差圖十分正常最終模型的結(jié)果可以應用去掉異常數(shù)據(jù)后的結(jié)果參數(shù)參數(shù)估計值置信區(qū)間a011200[1模型應用
制訂6種管理—教育組合人員的“基礎(chǔ)”薪金(資歷為0)組合管理教育系數(shù)“基礎(chǔ)”薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241中學:x3=1,x4=0;大學:x3=0,x4=1;更高:x3=0,x4=0x1=
0;x2=
1~管理,x2=
0~非管理大學程度管理人員比更高程度管理人員的薪金高
大學程度非管理人員比更高程度非管理人員的薪金略低
模型應用制訂6種管理—教育組合人員的“基礎(chǔ)”薪金(資歷為0對定性因素(如管理、教育),可以引入0-1變量處理,0-1變量的個數(shù)應比定性因素的水平少1軟件開發(fā)人員的薪金殘差分析方法可以發(fā)現(xiàn)模型的缺陷,引入交互作用項常常能夠改善模型
剔除異常數(shù)據(jù),有助于得到更好的結(jié)果注:可以直接對6種管理—教育組合引入5個0-1變量
對定性因素(如管理、教育),可以引入0-1變量處理,0-1變10.3酶促反應
問題研究酶促反應(酶催化反應)中嘌呤霉素對反應速度與底物(反應物)濃度之間關(guān)系的影響
建立數(shù)學模型,反映該酶促反應的速度與底物濃度以及經(jīng)嘌呤霉素處理與否之間的關(guān)系
設(shè)計了兩個實驗:酶經(jīng)過嘌呤霉素處理;酶未經(jīng)嘌呤霉素處理。實驗數(shù)據(jù)見下表:
方案底物濃度(ppm)0.020.060.110.220.561.10反應速度處理764797107123139159152191201207200未處理6751848698115131124144158160/10.3酶促反應問題研究酶促反應(酶催化反應)中嘌呤霉基本模型
Michaelis-Menten模型y~酶促反應的速度,x~底物濃度1
,2~待定系數(shù)底物濃度較小時,反應速度大致與濃度成正比;底物濃度很大、漸進飽和時,反應速度趨于固定值。酶促反應的基本性質(zhì)
xy01實驗數(shù)據(jù)經(jīng)嘌呤霉素處理xy未經(jīng)嘌呤霉素處理xy基本模型Michaelis-Menten模型y~酶促反線性化模型
經(jīng)嘌呤霉素處理后實驗數(shù)據(jù)的估計結(jié)果
參數(shù)參數(shù)估計值(×10-3)置信區(qū)間(×10-3)15.107[3.5396.676]20.247[0.1760.319]R2=0.8557F=59.2975p=0.0000對1
,2非線性
對1,2線性
線性化模型經(jīng)嘌呤霉素處理后實驗數(shù)據(jù)的估計結(jié)果參數(shù)參數(shù)估計線性化模型結(jié)果分析
x較大時,y有較大偏差1/x較小時有很好的線性趨勢,1/x較大時出現(xiàn)很大的起落
參數(shù)估計時,x較?。?/x很大)的數(shù)據(jù)控制了回歸參數(shù)的確定
1/y1/xxy線性化模型結(jié)果分析x較大時,y有較大偏差1/x較小時有[beta,R,J]=nlinfit(x,y,’model’,beta0)beta的置信區(qū)間MATLAB統(tǒng)計工具箱
輸入
x~自變量數(shù)據(jù)矩陣y~因變量數(shù)據(jù)向量beta~參數(shù)的估計值R~殘差,J~估計預測誤差的Jacobi矩陣
model~模型的函數(shù)M文件名beta0~給定的參數(shù)初值
輸出
betaci=nlparci(beta,R,J)非線性模型參數(shù)估計functiony=f1(beta,x)y=beta(1)*x./(beta(2)+x);x=;y=;beta0=[195.80270.04841];[beta,R,J]=nlinfit(x,y,’f1’,beta0);betaci=nlparci(beta,R,J);beta,betacibeta0~線性化模型估計結(jié)果[beta,R,J]=nlinfit(x,y,’mod非線性模型結(jié)果分析參數(shù)參數(shù)估計值置信區(qū)間1212.6819[197.2029228.1609]20.0641[0.04570.0826]畫面左下方的Export輸出其它統(tǒng)計結(jié)果。拖動畫面的十字線,得y的預測值和預測區(qū)間剩余標準差s=10.9337最終反應速度為半速度點(達到最終速度一半時的x值)為其它輸出命令nlintool給出交互畫面o~原始數(shù)據(jù)+~擬合結(jié)果
非線性模型結(jié)果分析參數(shù)參數(shù)估計值置信區(qū)間1212.6819混合反應模型
x1為底物濃度,x2為一示性變量
x2=1表示經(jīng)過處理,x2=0表示未經(jīng)處理
β1是未經(jīng)處理的最終反應速度
γ1是經(jīng)處理后最終反應速度的增長值
β2是未經(jīng)處理的反應的半速度點
γ2是經(jīng)處理后反應的半速度點的增長值在同一模型中考慮嘌呤霉素處理的影響混合反應模型x1為底物濃度,x2為一示性變量在o~原始數(shù)據(jù)+~擬合結(jié)果混合模型求解用nlinfit和nlintool命令估計結(jié)果和預測剩余標準差s=10.4000
參數(shù)參數(shù)估計值置信區(qū)間1160.2802[145.8466174.7137]20.0477[0.03040.0650]152.4035[32.413072.3941]20.0164[-0.00750.0403]2置信區(qū)間包含零點,表明2對因變量y的影響不顯著參數(shù)初值(基于對數(shù)據(jù)的分析)經(jīng)嘌呤霉素處理的作用不影響半速度點參數(shù)未經(jīng)處理經(jīng)處理o~原始數(shù)據(jù)混合模型求解用nlinfit和nlintoo~原始數(shù)據(jù)+~擬合結(jié)果未經(jīng)處理經(jīng)處理簡化的混合模型
簡化的混合模型形式簡單,參數(shù)置信區(qū)間不含零點剩余標準差s=10.5851,比一般混合模型略大估計結(jié)果和預測參數(shù)參數(shù)估計值置信區(qū)間1166.6025[154.4886178.7164]20.0580[0.04560.0703]142.0252[28.941955.1085]o~原始數(shù)據(jù)未經(jīng)處理經(jīng)處理簡化的混合模型簡化的混合模型形一般混合模型與簡化混合模型預測比較實際值一般模型預測值Δ(一般模型)簡化模型預測值Δ(簡化模型)6747.34439.207842.73585.44465147.34439.207842.73585.44468489.28569.571084.73567.0478……………191190.83299.1484189.05748.8438201190.83299.1484189.05748.8438207200.968811.0447198.183710.1812200200.968811.0447198.183710.1812簡化混合模型的預測區(qū)間較短,更為實用、有效預測區(qū)間為預測值Δ一般混合模型與簡化混合模型預測比較實際值一般模型預測值Δ(一注:非線性模型擬合程度的評價無法直接利用線性模型的方法,但R2與s仍然有效。酶促反應
反應速度與底物濃度的關(guān)系非線性關(guān)系求解線性模型
求解非線性模型機理分析嘌呤霉素處理對反應速度與底物濃度關(guān)系的影響混合模型
發(fā)現(xiàn)問題,得參數(shù)初值引入0-1變量簡化模型
檢查參數(shù)置信區(qū)間是否包含零點注:非線性模型擬合程度的評價無法直接利用線性模型的方法,但R10.4投資額與國民生產(chǎn)總值和物價指數(shù)
問題建立投資額模型,研究某地區(qū)實際投資額與國民生產(chǎn)總值(GNP)及物價指數(shù)(
PI
)的關(guān)系2.06883073.0424.5201.00001185.9195.0101.95142954.7474.9190.96011077.6166.491.78422631.7401.9180.9145992.7144.281.63422417.8423.0170.8679944.0149.371.50422163.9386.6160.8254873.4133.361.40051918.3324.1150.7906799.0122.851.32341718.0257.9140.7676756.0125.741.25791549.2206.1130.7436691.1113.531.15081434.2228.7120.7277637.797.421.05751326.4229.8110.7167596.790.91物價指數(shù)國民生產(chǎn)總值投資額年份序號物價指數(shù)國民生產(chǎn)總值投資額年份序號根據(jù)對未來GNP及PI的估計,預測未來投資額
該地區(qū)連續(xù)20年的統(tǒng)計數(shù)據(jù)
10.4投資額與國民生產(chǎn)總值和物價指數(shù)問題建立投資額時間序列中同一變量的順序觀測值之間存在自相關(guān)以時間為序的數(shù)據(jù),稱為時間序列
分析許多經(jīng)濟數(shù)據(jù)在時間上有一定的滯后性
需要診斷并消除數(shù)據(jù)的自相關(guān)性,建立新的模型若采用普通回歸模型直接處理,將會出現(xiàn)不良后果
投資額與國民生產(chǎn)總值和物價指數(shù)
……………………1.32341718.0257.9140.7676756.0125.741.25791549.2206.1130.7436691.1113.531.15081434.2228.7120.7277637.797.421.05751326.4229.8110.7167596.790.91物價指數(shù)國民生產(chǎn)總值投資額年份序號物價指數(shù)國民生產(chǎn)總值投資額年份序號時間序列中同一變量的順序觀測值之間存在自相關(guān)以時間為序的數(shù)據(jù)基本回歸模型投資額與GNP及物價指數(shù)間均有很強的線性關(guān)系t~年份,yt~投資額,x1t~GNP,x2t~物價指數(shù)0,1,2~回歸系數(shù)x1tytx2tytt~對t相互獨立的零均值正態(tài)隨機變量基本回歸模型投資額與GNP及物價指數(shù)間均有很強的線性關(guān)系t基本回歸模型的結(jié)果與分析
MATLAB統(tǒng)計工具箱
參數(shù)參數(shù)估計值置信區(qū)間0322.7250[224.3386421.1114]10.6185[0.47730.7596]2-859.4790[-1121.4757-597.4823]R2=0.9908F=919.8529p=0.0000剩余標準差s=12.7164沒有考慮時間序列數(shù)據(jù)的滯后性影響R2=0.9908,擬合度高模型優(yōu)點模型缺點可能忽視了隨機誤差存在自相關(guān);如果存在自相關(guān)性,用此模型會有不良后果基本回歸模型的結(jié)果與分析MATLAB統(tǒng)計工具箱參數(shù)參數(shù)自相關(guān)性的定性診斷
殘差診斷法模型殘差作殘差et~et-1散點圖大部分點落在第1,3象限t
存在正的自相關(guān)大部分點落在第2,4象限自相關(guān)性直觀判斷在MATLAB工作區(qū)中輸出et為隨機誤差t的估計值et-1ett
存在負的自相關(guān)基本回歸模型的隨機誤差項t
存在正的自相關(guān)自相關(guān)性的定性診斷殘差診斷法模型殘差作殘差et~et-1自回歸性的定量診斷自回歸模型ρ~自相關(guān)系數(shù)0,1,2~回歸系數(shù)ρ=
0無自相關(guān)性ρ>
0ρ<
0如何估計ρ
如何消除自相關(guān)性D-W統(tǒng)計量D-W檢驗
ut~對t相互獨立的零均值正態(tài)隨機變量存在負自相關(guān)性存在正自相關(guān)性廣義差分法
自回歸性的定量診斷自回歸模型ρ~自相關(guān)系數(shù)0,1,D-W統(tǒng)計量與D-W檢驗
檢驗水平,樣本容量,回歸變量數(shù)目D-W分布表n較大DW4-dU44-dLdUdL20正自相關(guān)負自相關(guān)不能確定不能確定無自相關(guān)檢驗臨界值dL和dU由DW值的大小確定自相關(guān)性D-W統(tǒng)計量與D-W檢驗檢驗水平,樣本容量,回歸變量數(shù)目D廣義差分變換
以*0,1
,2
為回歸系數(shù)的普通回歸模型原模型DW值D-W檢驗無自相關(guān)有自相關(guān)廣義差分繼續(xù)此過程原模型新模型新模型
步驟
原模型變換不能確定增加數(shù)據(jù)量;選用其它方法
廣義差分變換以*0,1,2為回歸系數(shù)的普通回投資額新模型的建立
DWold<dL
作變換
原模型殘差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教育成果提升保證承諾書9篇范文
- 提高文化軟實力建設(shè)承諾書3篇范文
- 2025湖北鄂州華容區(qū)城市建設(shè)投資有限公司面向社會招聘4人模擬試卷附答案詳解(完整版)
- 產(chǎn)品開發(fā)流程規(guī)范模板
- 2025貴州省人民醫(yī)院第十三屆貴州人博會引進人才10人模擬試卷含答案詳解
- 2025河北省人民醫(yī)院招聘模擬試卷參考答案詳解
- 2025年寧波市中醫(yī)院公開招聘派遣制護士20人考前自測高頻考點模擬試題及一套答案詳解
- 2025年湖南省低空經(jīng)濟發(fā)展集團有限公司第二次公開招聘12人考前自測高頻考點模擬試題及答案詳解(新)
- 2025廣東省惠東縣招聘公辦學校教師71人考前自測高頻考點模擬試題及答案詳解參考
- 2025黑龍江黑河市直招聘公益性崗位就業(yè)人員65人模擬試卷及1套完整答案詳解
- 萬夫一力天下無敵 課件-2023-2024學年高一上學期增強班級凝聚力主題班會
- 調(diào)試、試運行與移交管理方案
- GB/T 26655-2011蠕墨鑄鐵件
- 熱鍍鋅鋼管技術(shù)標準
- 周三多管理學第03章管理的基本原理
- 基礎(chǔ)生態(tài)學第4章種群及其基本特征課件
- 虛擬現(xiàn)實與增強現(xiàn)實頭戴顯示關(guān)鍵技術(shù)及應用項目
- 《電力工業(yè)企業(yè)檔案分類規(guī)則0大類》(1992年修訂版)
- GB∕T 26520-2021 工業(yè)氯化鈣-行業(yè)標準
- 溫州醫(yī)科大學《兒科學》支氣管肺炎
- 常見傳染病預防知識ppt-共47頁課件
評論
0/150
提交評論