2026屆高三數(shù)學(xué)一輪復(fù)習(xí)講義(基礎(chǔ)版)一元線性回歸模型及其應(yīng)用_第1頁
2026屆高三數(shù)學(xué)一輪復(fù)習(xí)講義(基礎(chǔ)版)一元線性回歸模型及其應(yīng)用_第2頁
2026屆高三數(shù)學(xué)一輪復(fù)習(xí)講義(基礎(chǔ)版)一元線性回歸模型及其應(yīng)用_第3頁
2026屆高三數(shù)學(xué)一輪復(fù)習(xí)講義(基礎(chǔ)版)一元線性回歸模型及其應(yīng)用_第4頁
2026屆高三數(shù)學(xué)一輪復(fù)習(xí)講義(基礎(chǔ)版)一元線性回歸模型及其應(yīng)用_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

§9.3一元線性回歸模型及其應(yīng)用

【課標(biāo)要求】1.了解樣本相關(guān)系數(shù)的統(tǒng)計含義.2.了解最小二乘法京理,掌握?元線性回歸模型參數(shù)的最小二

乘估計方法3針對實(shí)際問題,會用一元線性回歸模型進(jìn)行預(yù)測.

??落實(shí)主干知識??

1.變量的相關(guān)關(guān)系

⑴相關(guān)關(guān)系:兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)

系稱為相關(guān)關(guān)系.

⑵相關(guān)關(guān)系的分類:和.

⑶線性相關(guān):一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在附近,我

們就稱這兩個變量線性相關(guān).

2.樣本相關(guān)系數(shù)

n

E(x-x)(yr-y)

(l)r=fi=l廠.

、7pnpn

E(々一盼2E(yi-y)2

⑵當(dāng),>o時,稱成對樣本數(shù)據(jù);當(dāng)Y)時,稱成對樣本數(shù)據(jù).

(3)|“(1;當(dāng)加越接近1時,成對洋本數(shù)據(jù)的線性相關(guān)程度越;當(dāng)川越接近。時,成對樣本數(shù)

據(jù)的線性相關(guān)程度越.

3?一元線性回歸模型

⑴我們將i=晨+:稱為丫關(guān)于X的經(jīng)驗(yàn)回歸方程,

▼n

A£(苞一幻(%一刃

b=^-n-----,

其中<£⑺-標(biāo)

i=l

A_A_

a=y-bx.

(2)殘差:減去所得的差稱為殘差.

3自主診斷

1.判斷下列結(jié)論是否正確.(請?jiān)诶ㄌ栔写蚧?X”)

⑴相關(guān)關(guān)系是一種非確定性關(guān)系.()

(2)散點(diǎn)圖是判斷兩個變量相關(guān)關(guān)系的一種重要方法和手段.()

AAA

⑶經(jīng)驗(yàn)回歸直線,=次+。至少經(jīng)過g,yi),(X2,yi),(xn,y”)中的一個點(diǎn).()

(4)樣本相關(guān)系數(shù)越小,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.()

2.(多選)下列說法正確的是()

A.若兩個具有線性相關(guān)關(guān)系的變量的相關(guān)性越強(qiáng),則樣本相關(guān)系數(shù)〃的值越接近于1

B.當(dāng)廠=1時,兩變量呈函數(shù)關(guān)系

C.當(dāng)經(jīng)驗(yàn)回歸方程為i=0.3-0.7H寸,變量x和y負(fù)相關(guān)

D在經(jīng)驗(yàn)回歸方程i=0.4+0.5x中,當(dāng)x每增加1個單位時,相應(yīng)觀測值y一定增加0.5個單位

3.(2024?茂名模擬)已知變量x和y的統(tǒng)計數(shù)據(jù)如表:

X12345

y66788

根據(jù)上表可得經(jīng)驗(yàn)回歸方程)=06屋,據(jù)此可以預(yù)測當(dāng)x=8時,歹約等于()

A.8.5B.9C,9.5D.10

4.色差和色度是衡量毛絨玩具質(zhì)量優(yōu)劣的重要指標(biāo),現(xiàn)抽檢一批產(chǎn)品,已知該產(chǎn)品的色度少和色差、之間

滿足線性相關(guān)關(guān)系,且[0.&L1&現(xiàn)有一對測量數(shù)據(jù)為(33,25.2),則該數(shù)據(jù)的殘差為.

口微點(diǎn)提醒

1.經(jīng)驗(yàn)回歸直線過點(diǎn)(五y).

n

A八£x(yi-nxy

2.求b時,常用公式b二片----.

Exf-ru2

i=l

3.回歸分析是基于成對樣本觀測數(shù)據(jù)進(jìn)行估計或推斷,得出的結(jié)論都可能犯錯誤.

?探究核心題型?

題型一成對數(shù)據(jù)的相關(guān)性

例1(1)對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得如圖所示的散點(diǎn)圖,關(guān)于其樣本相關(guān)系數(shù)的比較,正確的是()

35

30

25

20

15

10

5

0

樣本相關(guān)系數(shù)八樣本相關(guān)系數(shù)「2

35

30

25

20

15

1()

5

0

樣本相關(guān)系數(shù)T樣本相關(guān)系數(shù)廠,

A.7*4<r2<0<7^)<r3B.7,2<z,4<0<r3<ri

Cj-2<?,4<0<ri<nDj-4<r2<0<n</-|

(2)(2024?石家莊模擬)某校為了解本校高一男生身高和體重的相關(guān)關(guān)系,在該校高一年級隨機(jī)抽取了7

名男生,測量了他們的身高和體重得下表:

身局IX

167173175177178180181

(單位:cm)

體重了

90545964677276

(單位:kg)

由表格制作成如圖所示的散點(diǎn)圖:

體重y/kg

100

90?

8()

70.???

60.

50,

40

3()

2()

)0

(16616817()172174176178180182身高工/切

由最小二乘法計算得到經(jīng)驗(yàn)回歸直線人的方程為,=;1X+K,其樣本相關(guān)系數(shù)為門;經(jīng)過殘差分析,點(diǎn)

(167,90)對應(yīng)殘差過大,把它去掉后,再用剩下的6組數(shù)據(jù)計算得到經(jīng)驗(yàn)回歸直線/2的方程為

y=b2x+a2,樣本相關(guān)系數(shù)為2則下列選項(xiàng)正確的是()

A.b[<b2,。戶。2,門〈r2

AAAA

B.b<b

12/a1<a2lr\>ri

八八AA

ax<a2lr]>r2

E(々-彳)(y「刃

附:

A1(xi-x)(yi-y)AA

b=^-------,a=y-bx.

£ON

i=l

命題點(diǎn)2非線性回歸模型

例3某大型現(xiàn)代化農(nóng)場在種植某種大棚有機(jī)無公害的蔬菜時,為創(chuàng)造更大價值,提高畝產(chǎn)量,積極

開展技術(shù)創(chuàng)新活動.該農(nóng)場采用了延長光照時間的方案,該農(nóng)場選取了20間大棚(每間一百)進(jìn)行試點(diǎn),

得到各間大棚產(chǎn)量數(shù)據(jù)并繪制成散點(diǎn)圖.光照時長為x(單位:小時),大棚蔬菜產(chǎn)量為歹(單位:噸面),

記vv=Inx.

產(chǎn)量.v

6.0-------------------

5.5----------------------------

5.0----------3---------------

45/

4.0--T------------

〉?...............

。6121824后W時長r

參考數(shù)據(jù):

2020202020202020

EX,£M£Wj£靖£支£wj£XiyiE忡

i=1i=1i=li=1i=1i=1i=li=l

290102.4524870540.281371578.2272.1

n

AAAA,EXiy-nxyAA

參考公式:j關(guān)于X的經(jīng)驗(yàn)回歸方程y=bx+Q中,b=------,a=y-bx.

Exf-nx2

i=l

⑴根據(jù)散點(diǎn)圖判斷,N=a+bx與產(chǎn)eWinx哪一個適宜作為大棚蔬菜產(chǎn)量),關(guān)于光照時長x的經(jīng)驗(yàn)回歸

方程類型(給出判斷即可,不必說明理由);

⑵根據(jù)⑴的判斷結(jié)果及表中數(shù)據(jù),建立J,關(guān)于X的經(jīng)驗(yàn)回歸方程(結(jié)果保留小數(shù)點(diǎn)后兩位);

⑶根據(jù)實(shí)際種植情況,發(fā)現(xiàn)上述回歸方程在光照時長位于6?14小時內(nèi)擬合程度良好,利用⑵中所求

方程估計當(dāng)光照時長為e?小時時(e為自然對數(shù)的底數(shù)),大棚蔬菜的畝產(chǎn)量.

思維升華求經(jīng)驗(yàn)回歸方程的步驟

算出好%。%通或本行-初為一刃,

4aLM尸的值

。i-i---------------------------------------------

利用公式計算2勾

寫出經(jīng)臉回歸方程5=強(qiáng)+/

跟蹤訓(xùn)練2(1)現(xiàn)有一組數(shù)據(jù)K如表所示,

X12345

yCe3e4e6e7

已知變量J關(guān)于X的非線性經(jīng)驗(yàn)回歸方程為,=")。3,若對,=ebx-0.3兩邊取自然對數(shù),可以發(fā)現(xiàn)]ny

與x線性相關(guān),則當(dāng)x=6時,預(yù)測y的值為()

A.8.7B.8C.e8-7D.e8

(2)(2024?新鄉(xiāng)模擬)氮氧化物是一種常見的大氣污染物,如圖為我國2014年至2022年氮氧化物排放量

(單位:萬噸)的折線圖,其中年份代碼1?9分別對應(yīng)年份2014?2022.

9999

已知£^12000,£8一力2R100,£(4一£)2k7.7,E砂251800.

i=1i=1i=1i=1

①可否用線性回歸模型擬合y與/的關(guān)系?請分別根據(jù)折線匿和樣本相關(guān)系數(shù)加以說明;

②若根據(jù)所給數(shù)據(jù)建立經(jīng)驗(yàn)回歸模型J=738什2025,可否用此模型來預(yù)測2025年和2035年我國的

氮氧化物排放量?請說明理由.

Ehyi-nly

附:樣本相關(guān)系數(shù),?二i=l

2

IE(tf-t)EI,-刃2

#=1t=l

題型三殘差分析

例4某公司為了解年研發(fā)資金M單位:億元)對年產(chǎn)值M單位:億元)的影響,對公司近8年的年研發(fā)

資金第和年產(chǎn)值1W/W8)的數(shù)據(jù)對比分析中,選用了兩個回歸模型,并利用最小二乘法求得

相應(yīng)的y關(guān)于x的經(jīng)驗(yàn)回歸方程:

①,二13.05x?48.4;②,=0.76r?8.98.

已知①中的殘差平方和SB3610,②中的殘差平方和S2458,請根據(jù)決定系數(shù)選擇擬合效果更好的經(jīng)

驗(yàn)回歸方程,并利用該經(jīng)驗(yàn)回歸方程預(yù)測年研發(fā)資金為20億元時的年產(chǎn)值.

8

參考數(shù)據(jù):E(y「歷2二32900.

i=1

參考公式:刻畫回歸模型擬合效果的決定系數(shù)火2=1-早一--

E(M-刃2

i=l

思維升華檢臉回歸模型的擬合效果的兩種方法

⑴殘差分析:通過殘差分析發(fā)現(xiàn)原始數(shù)據(jù)中的可疑數(shù)據(jù),判斷所建立模型的擬合效果.

⑵*分析:通過公式計算收,必越大,殘差平方和越小,模型的擬合效果越好;*越小,殘差平方和越

大,模型的擬合效果越差.

跟蹤訓(xùn)練3(1)(多選)下列命題中,說法正確的有()

A.在經(jīng)驗(yàn)回歸方程,二?0.3x+10中,當(dāng)解釋變量每增加1個單位時,響應(yīng)變量的預(yù)測值將減少0.3個單

B.經(jīng)驗(yàn)回歸直線,二晨+2恒過點(diǎn)(元刃,且在經(jīng)驗(yàn)回歸直線上的樣本點(diǎn)越多,擬合效果越好

C.殘差圖是一種散點(diǎn)圖,若殘差點(diǎn)比較均勻地落在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域中,說

明模型選擇比較合適,而且?guī)顓^(qū)域的寬度越窄,模型擬合的精度越高

D.決定系數(shù)外越大,表示殘差平方和越小,即模型的擬合效果越好

(2)(2024?呂梁模擬)某市2018年至2022年新能源汽車的年銷量M單位:百臺)與年份代號x的數(shù)據(jù)如表:

年份20182019202020212022

年份代號X01234

年銷量y1015203035

若根據(jù)表中的數(shù)據(jù)用最小二乘法求得關(guān)于x的回歸直線方程為,=6.5x+\據(jù)此可得時,殘差

為.

答案精析

落實(shí)主干知識

1.(2)正相關(guān)負(fù)相關(guān)(3)一條直線

2.⑵正相關(guān)負(fù)相關(guān)⑶強(qiáng)弱

3.(2)觀測值預(yù)測值

自主診斷

1.⑴、(2)4(3)X(4)X

2.BC[若兩個具有線性相關(guān)關(guān)系的變量的相關(guān)性越強(qiáng),則樣本相關(guān)系數(shù)〃的絕對值越接近于1,故A錯誤;

當(dāng)樣本相關(guān)系數(shù)〃=1時,兩變量呈確定的函數(shù)關(guān)系,故B正確;因?yàn)樾甭市∮?,所以變量x和歹負(fù)相關(guān),

故C正確;在經(jīng)驗(yàn)回歸方程,=0.4+Q5x中,當(dāng)x每增加1個單位時,相應(yīng)觀測值歹約增加0.5個單位,故

D錯誤]

3.D[依題意知,元=1+2+;+4+5=3,

—6-6+7+8+8r

y=—s-=7,

于是7=0.6X3+Q,解得a=5.2,

BPy=0.6x+5.2,

當(dāng)x=8時,y=0.6X8+5.2=10.]

4.0.6

解析將x=33代入

y=0.Sx-1.8,

可得(=0.8X33-1.8=24.6,

故數(shù)據(jù)(33,25.2)的殘差為25.2-24.6=0.6.

探究核心題型

例1(DB[由散點(diǎn)圖可知,樣本相關(guān)系數(shù),%心所在散點(diǎn)圖的兩個變量呈負(fù)相關(guān),門,門所在散點(diǎn)圖的兩

個變量呈正相關(guān),所以F々都為正數(shù),2小都為負(fù)數(shù)./2所在散點(diǎn)圖點(diǎn)的分布近似在一條直線上,線

性相關(guān)性匕瞰強(qiáng),樣本相關(guān)系數(shù)的絕對值接近1,而小小所在散點(diǎn)圖點(diǎn)的分布比較分散,線性相關(guān)性比

較弱,則/*2々4,r\>n,綜上所得,r2a4Vo々3%]

(2)A[身高的平均數(shù)為167+173+175+177+178+180+181

7

1231-176,

7

因?yàn)辄c(diǎn)(167,90)的橫坐標(biāo)167小于平均值176,縱坐標(biāo)90相對過大,

所以去掉點(diǎn)(167,90)后經(jīng)驗(yàn)回歸直線的縱截距變小而斜率變大,

“人AA

故瓦助2,ar>a2,

去掉點(diǎn)(167,90)后相關(guān)性更強(qiáng),擬合效果也更好,且還是正相關(guān),所以門<仁]

跟蹤訓(xùn)練1AB[因?yàn)榻?jīng)驗(yàn)回歸方程為$=5+2勺可知2>0,所以變量丁與x止相關(guān),故A止確;

由經(jīng)驗(yàn)回歸方程的性質(zhì)可知,經(jīng)驗(yàn)回歸直線一定經(jīng)過點(diǎn)(元y),故B正確;

樣本相關(guān)系數(shù)川越大,說明線性相關(guān)性越強(qiáng),反之,則越弱,網(wǎng)<|也所以〃與u之間的線性相關(guān)性更強(qiáng),

故C錯誤;

散點(diǎn)圖中所有點(diǎn)都在直線尸0.93—3.6上,則,|=1,且0.93X),所以變量I,與x正相關(guān),即,>0,可知〃

二1,故D錯誤]

例2解(1)由題意知,

—2+4+S+6+8.

X=--------=5,

-3-4+5+64-7e

5

所以£(Xi-x)(yi-y)=14,

i=1

55

EUj-x)2=20,£(%-刃2=10,

i=1i=1

5

£(Xi-x)(yi-y)

所以r=-F=0=,—

E幻2E刃2

Mi=li=l

14

->/20X7T0

=等0.99.

所以y與x呈正相關(guān),且線性相關(guān)程度很強(qiáng).

5

AE(x-x)(yr-y)

(2)因?yàn)閎=左%-------

E3-盼2

i=i

*°7

Ac

a=y-/?x=5-0.7X5=l.5,

所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為

y=0.7x+1.5,

當(dāng)x=12時,

y=0.7X12+1.5=9.9.

所以預(yù)測液體肥料每畝的使用量為12千克時,西紅柿畝產(chǎn)量的增加量為9.9百千克.

例3解(1)根據(jù)散點(diǎn)圖,開始的點(diǎn)在某條直線旁,但后面的點(diǎn)會越來越偏高這條直線,y=c+r/lnx

更適宜作為大棚蔬菜產(chǎn)量>,關(guān)于光照時長x的經(jīng)驗(yàn)回歸方程類型.

(2)w=\nx,貝!Jy=c+dlnx,

即歹二c+dw,

2D

£M

102.4

y=i=^—=5.12,

)2020

20

E1%

—i=1

W=——五一Z6,

20

23

AEw(y(-20wy

d-i^i__________

a~20

£wj-20w2

:=1

_272.l-20x2,6x5.12y

一~137-20x2.62~2b'

AA

C二9-d赤5.12-3.26X2.6

--3.36,

所以J=3.26w?3.36,

即,=3.261nx?3.36.

(3)當(dāng)x=6時,

y-3.261ne2-3.36=3.16.

即大棚蔬菜畝產(chǎn)量約為3.16噸.

跟蹤訓(xùn)練2(1)C[對兩邊取自然對數(shù),

AA

得Iny=bx-0.3,

令z=lny,貝舊二bx-0.3,z的數(shù)據(jù)如表所示:

X12345

3467

yeecee

Z13467

-1+24-3+4+5.

x=---5----=3,

—1+3+4+6+7.「

Z=——-——=4.2,

A

代入5二位?0.3,

A

得4.2=3b-03,

A

故b=L5.

故z=1.5.r-0.3,y=eL5v0-3.

當(dāng)X=6時,y=eL5X6-0.3=e&乙]

(2)①從折線圖看,各點(diǎn)落在一條直線附近,因而可以用線性回歸模型擬合),與/的關(guān)系,

由題意知£=^義(1+2+3+4+5+6+7+8+9)=5,

9

E4yL殉

樣本相關(guān)系數(shù)r=aE

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論