

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
10簡(jiǎn)單線>1>1>1>1主講:盧潔Ph.DE-mail:hanyaa800@辦公室:鄭大公衛(wèi)學(xué)院A510室統(tǒng)計(jì)學(xué)研究特點(diǎn):「■研究的是樣本,要對(duì)總體作出推斷抽樣研究K-I■得到的是頻率,要對(duì)概率作出推斷抽樣誤差■抽樣誤差■需進(jìn)行參數(shù)估計(jì)和假設(shè)檢驗(yàn)■利用“小概率原則”進(jìn)行統(tǒng)計(jì)推斷統(tǒng)計(jì)學(xué)學(xué)習(xí)的重點(diǎn)是掌握如何:>準(zhǔn)確的收集數(shù)據(jù);>準(zhǔn)確的錄入數(shù)據(jù);>正確的選用統(tǒng)計(jì)分析方法、調(diào)用統(tǒng)計(jì)分析程序;>對(duì)輸出的結(jié)果作出合理的解釋。統(tǒng)計(jì)學(xué)的主要內(nèi)容:r變量rr變量r定量資料L定性資料:頻率型指標(biāo)、強(qiáng)度型指標(biāo)、比J統(tǒng)計(jì)表和統(tǒng)計(jì)圖廠參數(shù)估計(jì):點(diǎn)估計(jì)、區(qū)間估計(jì)r對(duì)于單變量廠參數(shù)檢驗(yàn)r對(duì)于單變量廠參數(shù)檢驗(yàn)、非參數(shù)檢驗(yàn)對(duì)于兩變量:簡(jiǎn)單線性相關(guān)和回歸分析統(tǒng)計(jì)<推斷「假設(shè)檢劇定量資料]實(shí)驗(yàn)設(shè)計(jì)4>定性資料‘對(duì)于多變量:多重線性回歸'logistic分析數(shù)據(jù)資料類型$定性資料設(shè)計(jì)
類型設(shè)計(jì)$???類鄭*I定量資料Iwrsx匚“入條件類型丨條件*“、▼*不滿足進(jìn)配對(duì)RXC配對(duì)四篁驗(yàn)▼檢12X也四格表一F????<???????????????????|等級(jí)?I配對(duì)樣本丿兩多獨(dú)立上單樣本一…:■??????????■????????????????????????■?????■????????????????■?????????m配對(duì)第一…???????????*????????????????????????????????????*??????????????????????????????????乂兩獨(dú)立OH方畫分析秩疥I(/斑驗(yàn)回歸分析:是研究一個(gè)隨機(jī)變量如何隨另一個(gè)變量(可固定,也可隨機(jī))變化的。/如果你知道某一個(gè)人的身高和體重,你能知道這個(gè)人的手指有多粗嗎?/如果你知道患兒的月齡,你能換算出他體重是多少嗎?/考察父親身高與子女身高之間的關(guān)系?!翱疾焓杖胨脚c受教育程度之間的關(guān)系O
簡(jiǎn)單線i性回歸分析■10.1什么是■10.2簡(jiǎn)單線性歸模型/線性回歸方程的建立/回歸方程的解釋/線性回歸的前提條件/回歸方程的假設(shè)檢驗(yàn)回歸方程的統(tǒng)計(jì)應(yīng)用才"/ANIMATIONFACTORY1?線性回歸分析linearregressionanalysis:研究一個(gè)變量和另外一些變量間線性數(shù)量關(guān)系的統(tǒng)計(jì)分析方法。廠簡(jiǎn)單線性回歸simplelinearregression:模型中只包含兩個(gè)有“依存關(guān)系”的變量,一分J個(gè)變量隨另一個(gè)變量的變化而變化,且呈直線變類I化趨勢(shì),叫~。I多重線性回歸muptiplelinearregression涉及多個(gè)變量(自變量、解釋變量)時(shí)稱?。父親和他兒子的身高:調(diào)查了1087對(duì)父子:1?父代的總均數(shù)=68英寸
子代的總均數(shù)=69英寸2■高個(gè)子的父代:72英寸而它子代:71英寸矮個(gè)子的父代:64英寸而它子代:67英寸血曲兇allan(18221911}例10?1為研究大氣污染一氧化氮(NO)的濃度是否受到汽車流量、氣候狀況等因素的影響,選擇24個(gè)工業(yè)水平相近的一個(gè)交通點(diǎn),統(tǒng)計(jì)單位時(shí)間過(guò)往的汽車數(shù)(千輛),同時(shí)在低空相同高度測(cè)定了該時(shí)間段平均氣溫(°C)、空氣濕度(%)、風(fēng)速(m/s)以及空氣中一氧化氮(NO)的濃度(X10-6),數(shù)據(jù)如下表。表表10-124個(gè)城市交通點(diǎn)空氣中NO濃度監(jiān)測(cè)數(shù)據(jù)表表10-124個(gè)城市交通點(diǎn)空氣中NO濃度監(jiān)測(cè)數(shù)據(jù)-氧化氮(Y)車流量(X】)氣溫(X?)氣濕(X3)風(fēng)速(XJ一氧化氮(Y)車流量(&)氣溫(X2)氣濕%)風(fēng)速(XJ0?0661.30020.0800.450.0050.94822.5692.000.0761.44423.0570.500.0111.44021.5792.400.0010.78626.5641.500.0031.0842&5593.000.1701.65223.0840.400.1401.84426.0731.000.1561.75629.5720.900.0391.11635.0922.800.1201.75430.0760.800.0591.65620.0831.450.0401,20022.5691.800.0871.53623.0571.500.1201.50021.8770.600.0390.96024.8671.500.1001.20027.0581.700?2221.78423.3830.900.1291.47627.0650.650.1451.49.627.0650.650.1351.82022.0830>400.0291.06026.0581.830.0991.4362&0682.000.0991.4362&0682.00若丫隨X1、蜀、…、心的改變而改變:1變量dwpe/ule/ttvariable1變量dwpe/ule/ttvariablef反應(yīng)變量Yesponsevariable或:是按某種規(guī)律變化的隨機(jī)變量,是被估計(jì)2的被預(yù)測(cè)的變量。用“廠表示。^^^explanatoryvariable或^^^explanatoryvariable或自變量independentvariable或預(yù)測(cè)因子predictor可看作影響因素,是能獨(dú)立自由變化的變量,是廠所依存的變量,常用“X”廠所依存的變量,常用“X”表示,可是隨機(jī)變量,也可是人為控制或選擇的變量O
線性回歸關(guān)系的特點(diǎn):050211050211???ooO00X、鰹興ony—05■O0.00-?/?e*1■1ft0.751.001.251.50車流量/千輛1.752.00圖10-1NO濃度與車流量的散點(diǎn)圖各觀測(cè)點(diǎn)分布在直線周圍的束狀帶內(nèi);?當(dāng)變量X取某個(gè)值時(shí),變量Y取值可能有幾個(gè)。?變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)自然現(xiàn)象之間存在著大量相互聯(lián)系、相互依賴、相互制約的數(shù)量關(guān)系?!觥雒枋龃_定性現(xiàn)象的
確定性依存關(guān)系描述不確定性現(xiàn)象一隨機(jī)
現(xiàn)象的依存關(guān)系函數(shù)關(guān)系■正方形面積Y=X2▼回歸關(guān)系■▼舉例:年齡與身高
Y=a+pY|x10.么簡(jiǎn)單線性回歸模型的建立才"/ANIMATIONFACTORY
10.1.1解析:只考慮NO濃度和車流量的關(guān)系,問(wèn)之間是否存在數(shù)量依存關(guān)系?圖圖10-1NO濃度與車流量的散點(diǎn)圖圖10-1NO濃度與車流量的散點(diǎn)0繪制散點(diǎn)圖01X、超興ON200200性回歸分析。200200性回歸分析。從散點(diǎn)圖可見:車流量與空氣中NO濃度所對(duì)應(yīng)的點(diǎn)分布在一個(gè)線性束狀帶內(nèi),有線性的趨向,所以可以考慮做線圖圖10-1NO濃度與車流量的散點(diǎn)通常情況下,研究者只能獲得一定數(shù)量的樣本數(shù)據(jù),用樣本數(shù)據(jù)建立的有關(guān)Y依從X變化的線性表達(dá)式稱為回歸方程(regressionequation),記為:0-75LOO1.251.501.752.000-75LOO1.251.501.752.00車流量/千輛5o5o>5o?2.2JJQhooooooo02X、姿興ON9—Y=a+bx那么在總體中,可能存在對(duì)應(yīng)的方程模型:回歸直線的截距參數(shù)(intercept)〃丫|x=a+BX回歸直線的斜率參數(shù)(slope)|又稱回歸系數(shù)(regressioncoefficient)(三)回歸參數(shù)的估計(jì):最小二乘估計(jì)(p'pow年蠱礎(chǔ)58005300■4800(p'pow年蠱礎(chǔ)58005300■4800?4300?3800?3300?2800-30leastsquareestimation讓所有點(diǎn)的£的平方和最小354045505560657075體重(kg)?:?用最小二乘法擬合直線,選揪和〃使其殘差(樣本點(diǎn)到直線的垂直距離)平方和達(dá)到最小O
回歸參數(shù)的估計(jì)方法:用最小二乘法擬合直線,選揪和〃使其殘差(樣本點(diǎn)到直線的垂直距離)平方和達(dá)到最小。即:使下列的SSE達(dá)到最小值。SSE=Y(”—刃)2=工0嚴(yán)號(hào))2回歸方程:Y-a+bx回歸方程:Y-a+bx(1)n工(X廠壬)(E-力L(2)a=Y-bX
求:NO濃度和車流量間的簡(jiǎn)單線性回歸方程?表24個(gè)城市交通點(diǎn)空氣中NO濃度監(jiān)測(cè)數(shù)據(jù)一氧化氮(Y)車流量(XJ氣溫(X2)氣濕(X3)風(fēng)速(XJ一氧化氮(Y)車流量(&)氣溫(X2)氣濕(XJ風(fēng)速(XJ0?0661.30020.0800.450.0050.94822.5692.000.0761.44423.0570.500.0111.44021.5792.400.0010.78626.5641.500.0031.0842&5593.000.1701.65223.0840.400.1401.84426.0731.000.1561.75629.5720.900.0391.11635.0922.800.1201.75430.0760.800.0591.65620.0831.450.0401?20022.5691.800.0871.53623.0571.500.1201.50021.8770.600.0390.96024.8671.500.1001.20027.0581.700.2221.78423.3830.900.1291.47627.0650.650.1451.49.627.0650.650.1351.82022.0830>400?0291.06026.0581.830.0991.4362&0682.000.0991.4362&0682.00
(三)建立回歸方程,作回歸直線圖解:⑴由樣本數(shù)據(jù)了解計(jì)算統(tǒng)計(jì)量,帶入下公式,求出回歸系數(shù)〃土(Xi-壬)a-Y)b=上』=-z—=0.1584力(N—X)2⑵帶入下公式,求出回歸截矩Qci=Y—0.1353⑶最小二乘法原則下的回歸方程為:y=-0.1353+0.1584X■▼圖10-1NO濃度與車流疑的散點(diǎn)圖圖10-1NO濃度與車流疑的散點(diǎn)圖圖圖10-1NO濃度與車流量的散點(diǎn)圖回歸方程的解釋y--0.1353+0.回歸方程的解釋y--0.1353+0.1584X52?OY-a+bx。2X80^0-75LOO1.25L501?752.0052?OY-a+bx。2X80^0-75LOO1.25L501?752.00車流量/千輛O5o>5o21100????ooooo/a的意義?/y的意義/y—$的意義?0—總體回歸系數(shù)(regressioncoefficient)0的統(tǒng)計(jì)學(xué)意義:X每增加(或減少)一個(gè)單位,Y平均改變了個(gè)0單位;〃越大,表示Y隨X增減變化的趨勢(shì)越陡?!?>0,表明Y與X呈同向線性變化趨勢(shì)■"0,表明Y與X無(wú)線性回歸關(guān)系,但可能有其它關(guān)系■〃v0,表明Y與X呈反向線性變化趨勢(shì)3?線性回歸分析的前題條件:線性(linear)獨(dú)立性(independent)正態(tài)性(normal)等方差性(equalvariance)Yyix=a+pX圖Yyix=a+pX圖12?3線性回歸模型的適用條件示意圖3.線性回歸分析的前題條件inellinearindependentnormalequalvariance線性反應(yīng)變量丫的
總體平均值
與自變量X呈
線性關(guān)系獨(dú)立性指任意兩個(gè)觀察值互相獨(dú)立正態(tài)性等方差性在一定范圍內(nèi)任意給定X值,則對(duì)應(yīng)的隨機(jī)變量Y服從正態(tài)分布圍內(nèi),1¥丫總體變異程度相同(四)(四)回歸方程有統(tǒng)計(jì)學(xué)意義嗎?X圖10_3X圖10_3Y的總變異分解示意圖總體回歸系數(shù)0的統(tǒng)計(jì)推斷:樣本????》樣本回歸方程AY-a+樣本????》樣本回歸方程AY-a+bx由于樣本回歸系數(shù)〃與總體回歸系數(shù)0存在抽樣誤差,即:一般情況下,b科,因此需要考慮抽樣誤差對(duì)統(tǒng)計(jì)推斷是否存在重大影響?就總體而言,這種回歸關(guān)系是否存在?
即總體回歸方程是否成立?A目的:檢驗(yàn)求得的回歸方程在總體中是否成立;A方法:?jiǎn)我蛩胤讲罘治?。歸系數(shù)的假設(shè)檢驗(yàn):A目的:即檢驗(yàn)總體回歸體系數(shù)"是否為0(0=0);A方法:t檢驗(yàn)?;貧w模型的假設(shè)檢驗(yàn)一方差分析Y(X,Y)Y(X,Y)Z)SS總(總平方和)SW回歸(回歸平方和)SS殘差(殘差平方和)SS總沁歸+SS殘差卩總二加變異的分解:變異的種類產(chǎn)生原因解釋SS總:》(—可Y的離均差平方和SS回歸:藝任=打(回歸平方和)SS殘差:加pj(殘差平方和)沒(méi)有利用X的信息時(shí),丫觀察值的變異當(dāng)自變量X引入
模型后所引起的變
異總變異中無(wú)法用X和Y的回歸關(guān)系解釋的那部分變異反映因變量Y的總變異反映在丫的總變異中,可用丫與x的線性關(guān)系解釋的那部分變異。SS回歸越大,說(shuō)明回歸效果越好。反應(yīng)自變量X以外因素對(duì)Y的變異的影響。表示考慮回歸之后,丫的隨機(jī)誤差。回歸方程假設(shè)檢驗(yàn)的基本思想:A如果總體中自變量X對(duì)因變量Y沒(méi)有貢獻(xiàn),則由樣本所得的回歸均方與殘差均方應(yīng)相近;A反之,如果總體中自變量X對(duì)因變量艙貢獻(xiàn),回歸平方和反應(yīng)的就不僅僅是隨機(jī)誤差,即回歸均方必然要遠(yuǎn)大于殘差均方;A依此,可計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值作出判斷。
問(wèn):所求得的回歸方程在總體中是否成立?均方:MS=SS/v「回歸均方:MS回歸二SS回/回歸「殘差均方:MS殘差二SS均方:MS=SS/v「回歸均方:MS回歸二SS回/回歸「殘差均方:MS殘差二SS殘S殘差檢驗(yàn)統(tǒng)計(jì)量:FMS回歸_MS殘差■查F界值表(P572),確定單側(cè)臨界值耳(卩回歸,$殘差),求概率值P,下結(jié)論建立假設(shè),確定檢驗(yàn)水準(zhǔn)Ho:總體回歸方程不成立,即總體中自變量X對(duì)因變量Y沒(méi)有貢獻(xiàn);Hi:總體回歸方程成立,即總體中自變量X對(duì);因變時(shí)丫有貢獻(xiàn)。c^0.05(單狽!|)
計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值:表10-2簡(jiǎn)單線性回歸模型方差分析表變異來(lái)源SSdfMSFP回歸0.053010.053041.376<0.0001殘差0.0282220.0013總變異0.081223查F界值表(P572):a=0.05,"回歸=1、卩殘差=加2=22得:F(k-l,n-k)=F(l,22)=4.303?確定P值,作岀推斷結(jié)論:由于F=41?376>4?30,貝!|P<0.05,故拒絕碼,接受碼,可認(rèn)為在a=0.05的顯著水平上,NO濃度與車流量之間的回歸方程具有統(tǒng)計(jì)學(xué)意義。2?回歸系數(shù)的假設(shè)檢驗(yàn)一/檢驗(yàn)由總體回歸方Y(jié)X=?+fixA當(dāng)0=0時(shí),flYlx=a
即:對(duì)于X的任何值,總體均數(shù)“”沒(méi)有任何改變,
故建立為x的直線回歸方程就沒(méi)有任何意義了■▼故0是否為0,涉及到所建立的回歸方程是否有意義的問(wèn)
題。然而從卩=0的總體抽得樣本,計(jì)算出的回歸系數(shù)〃很
可能不為零,需要對(duì)0是否等于0進(jìn)行假設(shè)檢驗(yàn)一/檢驗(yàn)0=0,說(shuō)明Y與X之間并不存在線性關(guān)系0丸,說(shuō)明Y與X之間存在線性關(guān)系
t檢驗(yàn):b-QSbSb殘差V殘差Vn-2Y=n-2
檢驗(yàn)過(guò)程:建立檢驗(yàn)假設(shè),確認(rèn)檢驗(yàn)水準(zhǔn)Ho:=0;Hi:0工0;a=0.05計(jì)算統(tǒng)計(jì)量(值b-0Sbb—0匹(;箱_0b-0Sbb—0匹(;箱_0」584-0.0246=6.432(3)確定P值,作出推斷結(jié)論v=22時(shí),査/界值表得,f(0.05/2,22)=2.074,故PV0.05o以心0?05拒絕Ho,接受鳳,差別有統(tǒng)計(jì)學(xué)意義;故可認(rèn)為該回歸系數(shù)〃具有統(tǒng)計(jì)學(xué)意義。注意:1?在簡(jiǎn)單線性回歸模型中,對(duì)回歸模型的方差分析等價(jià)于對(duì)回歸系數(shù)的/檢驗(yàn),即有:2?對(duì)于服從雙變量正態(tài)分布的同樣一組資料,同時(shí)作相關(guān)分析和回歸分析,則相關(guān)系數(shù)的/檢驗(yàn)與回歸系數(shù)數(shù)的/檢驗(yàn)等價(jià),即有:
(五)總體回歸系數(shù)“的區(qū)間估計(jì):已知〃為回歸系數(shù)的樣本估計(jì)值,Sb為樣本回歸系數(shù)的標(biāo)準(zhǔn)誤,則總歸系數(shù)的標(biāo)準(zhǔn)誤,則總體回歸系數(shù)0的雙側(cè)1-Q置信區(qū)間為:b土(a/2,v'b上例題中〃二0.1584,Sb=0.0246,心22,查f界值表得:如)5/2,22=2?074;貝!|其總體回歸系數(shù)的雙側(cè)95置信區(qū)間為:0.1584土2.074X0.0246=(0.1074,0.2095)線性回歸分析:【電腦實(shí)現(xiàn)】1.數(shù)據(jù)錄入旨Untitled一SPSSDataEditorFileEditViewDataTransformAns色ia尋罔燈J?=C?開£i甜:11編號(hào)NO車流量|55.156175666.1201.75477.0101.20088.1201.50099.1001.2001010.1291.4761111.1351.8201212.0991.4361313.005.9481414.0111.4401515.0031.0841616.1401.8441717.0391.1161818.0591.65619190871.5362020.039.9602121.22217842222.1451.4962323.0291.0602424.0991.436—SPSS2?線性回歸分析的步驟:jEditViewDataTransform.AnalyzeGraphsUtilitiesWindo-wHelp劇昌導(dǎo)G1=0?3.001OKHelpQptim.alScalin.g?.?CaseLabels:WLSWeight:Jntitled一SPSSDataEditorBinaryLogistic???MultinomialLogistic...Ordinal…Probit??■Linear???CurveEstimation...Nonlinear???WeightEstijnation???2-StageLeastSquares...編專1~~2J04l丄2316171819DataView16171819亦1.8441J16T.666i?536qfinno__.O66T076PasteResetCancel.140.039.059—w—「rnq'"VariableViewResortsDescriptiveStatisticsTablesCompareNeansGeneralLinearModelMixed.ModelsCorrelateRegressionLoglinearClassifyDataReduction.ScaleNonparametricTestsTimeSeriesSurvivalMultipleResponseMissingValueAnalysis...ComplexSamplesvar發(fā)編號(hào)⑥車疣星Dependent:區(qū)NOBlock1of1PreviousI,ndependent(s):-車據(jù)Method:EnterSelectionVariable:Statistics...:Plots..?|[Sve...Options...Ia.DependentVariable:NOa.DependentVariable:NOa.DependentVariable:NOa.DependentVariable:NO3?結(jié)果及結(jié)果輸出:anov¥ModelSumofSquaresdfMeanSquare廠FSig.1Regression.0531.053(41.376.000aResidual.02822.001Total.08123\a.Predictors:(Constant),車流量b?DependentVariable:NOCoefficient^ModelUnstandardizedCoefficientsStandardizedCoefficientstSig.B_Std.ErrorBeta1(Constant)車流量7^.135^\.035).025.808fcavx@432?VzVz1.000(六)回歸方程的解釋:車流量對(duì)NO濃度的影響有多大?決定系數(shù):回歸平方和與總平方和之比?;貧wssTR2SSrFHiti]回歸ssTR2_—SS單?0WWS1?反映了自變量X對(duì)回歸效果的貢獻(xiàn),即Y的總變異中回歸關(guān)系所能解釋的百分比(varianceaccountformula,VAF);?反映了回歸模型的擬合效果,可作為反應(yīng)擬合優(yōu)度(goodnessoffit)的指標(biāo)。上例題:SS總=0.0812,SS回歸=0.0530R2=SS回莎SS總=0.0530/0.0812=0.砧27=65.27%解釋:說(shuō)明空氣中NO濃度總變異的砧?27%與車流量有關(guān)。(七)回歸方程的統(tǒng)計(jì)應(yīng)用:?定量描述兩變量之間的依存關(guān)系O?利用回歸方程進(jìn)行統(tǒng)計(jì)預(yù)測(cè)。?利用回歸方程進(jìn)行統(tǒng)計(jì)控制。1?統(tǒng)計(jì)預(yù)測(cè):將X值作預(yù)報(bào)因子,固定總體中X為某定值時(shí),估計(jì)個(gè)體丫值的容許區(qū)間,即丫值的波動(dòng)范圍。例:當(dāng)車流量為1300輛,求空氣中一氧化氮95%的容許區(qū)間。答:已知回歸方程4-0.1353+0.1584XX=1.300時(shí):f=-0.1353+0.1584x1.3=0.0707故空氣中NO的98%容許區(qū)間為:0.0707±2.074x0.0358^piH^=(0.0000?0.1467)x10"2?均數(shù)置信區(qū)間:當(dāng)X值為某定值,并給定置信度1-?,考察Y的總體均數(shù)的分布時(shí),可估計(jì)Y的總Y|X的1臨置信區(qū)間丫±匚/2,“一2?55例:當(dāng)車流量為1300輛,求空氣中一氧化氮95%的置信區(qū)間。答:已知回歸方程4-0.1353+0.1584XX=1.300時(shí):f=-0.1353+0.1584x1.3=0.0707故空氣中NO的95%置信區(qū)間為:0.0707±2.074x0.0358./—+(L^Z.L4Q35)V242.1124=(0.05465?0.08675)x10,均數(shù)的置信區(qū)間和個(gè)體容許區(qū)間的不同:9I0X、變ON0?75—1.001.259I0X、變ON0?75—1.001.251.50^^1.75—2.0020?O5101005000@車流量/千輛車流量/千輛OIX回歸方程、均數(shù)的置OIX回歸方程、均數(shù)的置:信區(qū)間與個(gè)體容許區(qū)間圖統(tǒng)計(jì)控制:例:該城市為降低空氣中NO的含量,擬對(duì)車流量進(jìn)行適當(dāng)?shù)目刂?,根?jù)空氣污染指數(shù)分級(jí),要求空氣中氮氧化合物含量不超過(guò)0.100-0.150X106o答:已知回歸方程¥=-0.1353+0.1584X當(dāng)乙=0.100x10—6時(shí),X]=(0?100+0?135)/0?1584=1?485(千輛)當(dāng)嶺=0.150x10"時(shí),X]=(0?150+0.135)/0?1584=1?801(千輛)故該城市單位時(shí)間內(nèi)車流量應(yīng)控制在1500輛以內(nèi),最多不超過(guò)1800輛,否則會(huì)導(dǎo)致輕度污染的發(fā)生。簡(jiǎn)單線性回歸分析的注意事項(xiàng):1.要注意實(shí)際意義;2.繪制散點(diǎn)圖觀察兩變量的關(guān)系以及找出異常點(diǎn);注意自變量和因變量的變化范圍。小結(jié)A簡(jiǎn)單線性回歸是指只包含一個(gè)自變量,且呈線性變化趨勢(shì)的回歸模型,用于描述因變量的總體均數(shù)與自變量之間的線性關(guān)系,即兩變量間的依存變化關(guān)系。A簡(jiǎn)單線性回歸的基本步驟:繪制散點(diǎn)圖,在最小二乘法原則下建立線性回歸方程,即估計(jì)回歸系數(shù)與截距;對(duì)回歸方程或回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn);列出回歸方程,繪制回歸直線;統(tǒng)計(jì)解釋及應(yīng)用。A線性回歸模型的適用條件為:線性、獨(dú)立、正態(tài)和等方差,簡(jiǎn)稱LINE。A決定系數(shù)反映了回歸平方和在總平方和中所占的比例,常用來(lái)反映回歸的實(shí)際效果。A線性回歸常用于統(tǒng)計(jì)預(yù)測(cè)和統(tǒng)計(jì)控制oA當(dāng)兩變量變化趨勢(shì)為非線性時(shí),可考慮擬合非線性回歸議程,常用的曲線類型包括指數(shù)曲線,多項(xiàng)式曲線、雙典線和logistic曲線等。A注意線性相關(guān)與線性回歸的區(qū)別與聯(lián)系o相去分樁是用來(lái)描述兩變量的相關(guān)關(guān)系,當(dāng)兩變量滿足雙變量正態(tài)分布時(shí),可以計(jì)算Pearson積差相關(guān)系數(shù),如果有任何一個(gè)變量不滿足正態(tài)分布或?yàn)榈燃?jí)資料,需計(jì)算Spearman秩相關(guān)系數(shù)。歸會(huì)樁是用來(lái)刻畫兩變量的依存關(guān)系,它要求資料滿足LINE(線性、獨(dú)立、正態(tài)和等方差),二者之間既有聯(lián)系又有區(qū)別。
區(qū)別點(diǎn)直線回歸直線相關(guān)資料要求固定X,應(yīng)變量Y服從正態(tài)分布,X是可以精確測(cè)量和嚴(yán)格控制的變量,也可是隨機(jī)變量。兩個(gè)變量X、Y服從雙變量正態(tài)分布。用途y的總體均數(shù)變化與x之間的直線關(guān)系說(shuō)明兩變量間的相關(guān)關(guān)系意義b表示X每增(減)一個(gè)單位時(shí),Y平均改變b個(gè)單位「說(shuō)明具有直線關(guān)系的兩個(gè)變量間關(guān)系的密切程度與相關(guān)方向計(jì)算b二LJ—r~LX)'/jSLyy取值范圍——ooVb<+oo-l<r<l單位b有單位r沒(méi)有單位
聯(lián)系:①方向一致:對(duì)一組數(shù)據(jù)若能同時(shí)計(jì)算廠和0,它們的符號(hào)一致。②假設(shè)檢驗(yàn)等價(jià):對(duì)同一樣本,和②假設(shè)檢驗(yàn)等價(jià):對(duì)同一樣本,和0的假設(shè)檢驗(yàn)得到的f值相等,即tb=tro[2用回歸解釋相關(guān):決定系數(shù)疋二宀十“回/SS總,決定?Jyy系數(shù)越大,即回歸平方和越接近總平方和,說(shuō)明構(gòu)建的回歸方程越好,兩變量間的相關(guān)關(guān)系越密切。案例討論案例10?1:年齡與身高預(yù)測(cè)研究。某地調(diào)查了4~18歲男孩與女孩身高,數(shù)據(jù)見下表,試描述男孩與女孩身高與年齡間的關(guān)系,并預(yù)測(cè)10?5歲、16?5歲、19歲與20歲男孩與女孩的身高。表10?4某地男孩與女孩平均身高與年齡的調(diào)查數(shù)據(jù)年齡平均身高年齡平均身高年齡平均身高男孩女孩男孩女孩男孩女孩4.0102.1101.2&0126.8126.314.0162.5157.14.5105.3104.59.0132.2131.815.0166.1157.75.010&6107.610.0136.6137.916.0169.015&75.5111.6110.811.0142.3144.117.0170.615&96.0116.2115.112.0147.2150.01&0170.715&97.0122.5121.113.0156.3155.1
釆用SPSS對(duì)身高與年齡進(jìn)行回歸分析,結(jié)果如下表所示。*10-5男孩身高對(duì)年齡的簡(jiǎn)單線性回歸分析結(jié)果估計(jì)值標(biāo)準(zhǔn)誤估計(jì)值標(biāo)準(zhǔn)誤constant83.73631.882444.48390.0000age5.2748990.9&constant83.73631.882444.48390.0000age5.2748990.9&R2=98.5%0.167631.47980.0000表12?6女孩身高對(duì)年齡的簡(jiǎn)單線性回歸分析結(jié)果估計(jì)值標(biāo)準(zhǔn)誤t廠constant88.43263.280026.96110.0000age4.53400.292015.52900.0000F=241?15,F(xiàn)=94.1%經(jīng)擬合簡(jiǎn)單線性回歸模型,t檢驗(yàn)結(jié)果提示回歸方程有非常顯著的統(tǒng)計(jì)學(xué)意義。結(jié)果提示,擬合效果非常好,故可認(rèn)為:(1)男孩與女孩的平均身高隨年齡線性遞增,年齡每增長(zhǎng)1歲,男孩與女孩身高分別平均增加5.27cm,4.53cm,男孩生長(zhǎng)速度快于女孩的生長(zhǎng)速度。(2)依照回歸方程預(yù)測(cè)該地男孩10?5、16?5、19和20
歲的平均身高依次為139.12、170.77>183.96和189.23cm,該地女孩10?5、16.5>19和20歲的平均身高依次為136.04、163.24、174.58和179.11cm.
針對(duì)以上分析結(jié)果
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 婦幼健康考試題及答案
- 主語(yǔ)從句試題及答案
- 材料概論考試題及答案
- Unit 4 單元測(cè)試 提升卷(解析版)
- 軍人晉級(jí)面試題及答案
- 農(nóng)村信用社考試題庫(kù)及答案
- 2025年基本本考試題庫(kù)
- 2025年消防考試題庫(kù)隨機(jī)
- 2025年旅游專業(yè)考試題目及答案
- 2025年煤礦持證上崗考試題庫(kù)
- 期中評(píng)估測(cè)試卷(含答案) 2025-2026學(xué)年數(shù)學(xué)人教版九年級(jí)上冊(cè)
- 居民供水應(yīng)急預(yù)案方案(3篇)
- 鐵路建設(shè)項(xiàng)目質(zhì)量安全紅線管理考試試題及答案
- 廠房鋼結(jié)構(gòu)屋面與彩鋼板施工規(guī)劃與方案
- 施工現(xiàn)場(chǎng)防汛安全檢查記錄表
- 扭扭棒手工培訓(xùn)
- 服務(wù)溝通技巧培訓(xùn)課件
- 2025年時(shí)事政治考試100題(含參考答案)
- 切削刀具項(xiàng)目實(shí)施方案
- 美國(guó)專利法及實(shí)務(wù)培訓(xùn)-上傳課件
- 新版中國(guó)電信員工手冊(cè)
評(píng)論
0/150
提交評(píng)論