2020版高考數(shù)學第九章算法初步、統(tǒng)計、統(tǒng)計案例第四節(jié)變量間的相關關系、統(tǒng)計案例學案新人教A版.docx_第1頁
2020版高考數(shù)學第九章算法初步、統(tǒng)計、統(tǒng)計案例第四節(jié)變量間的相關關系、統(tǒng)計案例學案新人教A版.docx_第2頁
2020版高考數(shù)學第九章算法初步、統(tǒng)計、統(tǒng)計案例第四節(jié)變量間的相關關系、統(tǒng)計案例學案新人教A版.docx_第3頁
2020版高考數(shù)學第九章算法初步、統(tǒng)計、統(tǒng)計案例第四節(jié)變量間的相關關系、統(tǒng)計案例學案新人教A版.docx_第4頁
2020版高考數(shù)學第九章算法初步、統(tǒng)計、統(tǒng)計案例第四節(jié)變量間的相關關系、統(tǒng)計案例學案新人教A版.docx_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第四節(jié)變量間的相關關系、統(tǒng)計案例2019考綱考題考情1兩個變量的線性相關(1)正相關在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關。(2)負相關在散點圖中,點散布在從左上角到右下角的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為負相關。(3)線性相關關系、回歸直線如果散點圖中點的分布從整體上看大致在一條直線附近,我們就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線。2回歸方程(1)最小二乘法使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小的方法叫做最小二乘法。(2)回歸方程方程x是兩個具有線性相關關系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)的回歸方程,其中,是待定參數(shù)。3回歸分析(1)定義:對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法。(2)樣本點的中心對于一組具有線性相關關系的數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)中(,)稱為樣本點的中心。(3)相關系數(shù)當r0時,表明兩個變量正相關;當r3.841,這表明小概率事件發(fā)生。根據(jù)假設檢驗的基本原理,應該斷定“是否選修文科與性別之間有關系”成立,并且這種判斷出錯的可能性約為5%。答案5%二、走近高考3(2017山東高考)為了研究某班學生的腳長x(單位:厘米)和身高y(單位:厘米)的關系,從該班隨機抽取10名學生,根據(jù)測量數(shù)據(jù)的散點圖可以看出y與x之間有線性相關關系,設其回歸直線方程為x。已知i225,i1 600,4。該班某學生的腳長為24,據(jù)此估計其身高為()A160B163C166D170解析易知22.5,160。因為4,所以160422.5,解得70,所以回歸直線方程為4x70,當x24時,9670166。故選C。答案C三、走出誤區(qū)微提醒:混淆相關關系與函數(shù)關系;不知道回歸直線必過樣本點中心;對獨立性檢驗K2值的意義不清楚。4兩個變量的相關關系有正相關,負相關,不相關,則下列散點圖從左到右分別反映的變量間的相關關系是()ABCD解析第一個散點圖中,散點圖中的點是從左下角區(qū)域分布到右上角區(qū)域,則是正相關;第三個散點圖中,散點圖中的點是從左上角區(qū)域分布到右下角區(qū)域,則是負相關;第二個散點圖中,散點圖中的點的分布沒有什么規(guī)律,則是不相關,所以應該是。答案D5某醫(yī)療機構(gòu)通過抽樣調(diào)查(樣本容量n1 000),利用22列聯(lián)表和K2統(tǒng)計量研究患肺病是否與吸煙有關。計算得K24.453,經(jīng)查閱臨界值表知P(K23.841)0.05,現(xiàn)給出四個結(jié)論,其中正確的是()A在100個吸煙的人中約有95個人患肺病B若某人吸煙,那么他有95%的可能性患肺病C有95%的把握認為“患肺病與吸煙有關”D只有5%的把握認為“患肺病與吸煙有關”解析由已知數(shù)據(jù)可得,有10.0595%的把握認為“患肺病與吸煙有關”。故選C。答案C6某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此進行了5次試驗。根據(jù)收集到的數(shù)據(jù)(如下表),由最小二乘法求得回歸方程為0.67x54.9。零件數(shù)x/個1020304050加工時間y/min62758189現(xiàn)發(fā)現(xiàn)表中有一個數(shù)據(jù)模糊看不清,則該數(shù)據(jù)為_。解析設表中那個模糊看不清的數(shù)據(jù)為m。由表中數(shù)據(jù)得30,所以樣本點的中心為,因為樣本點的中心在回歸直線上,所以0.673054.9,解得m68。答案68考點一變量相關關系的判斷【例1】(1)下列四個散點圖中,變量x與y之間具有負的線性相關關系的是()(2)為研究語文成績和英語成績之間是否具有線性相關關系,統(tǒng)計某班學生的兩科成績得到如圖所示的散點圖(x軸、y軸的單位長度相同),用回歸直線方程x近似地刻畫其相關關系,根據(jù)圖形,以下結(jié)論最有可能成立的是()A線性相關關系較強,的值為1.25B線性相關關系較強,的值為0.83C線性相關關系較強,的值為0.87D線性相關關系較弱,無研究價值解析(1)觀察散點圖可知,只有D選項的散點圖表示的是變量x與y之間具有負的線性相關關系。故選D。(2)由散點圖可以看出兩個變量所構(gòu)成的點在一條直線附近,所以線性相關關系較強,且應為正相關,所以回歸直線方程的斜率應為正數(shù),且從散點圖觀察,回歸直線方程的斜率應該比yx的斜率要小一些,綜上可知應選B。答案(1)D(2)B相關關系的直觀判斷方法就是作出散點圖,若散點圖呈帶狀且區(qū)域較窄,說明兩個變量有一定的線性相關性,若呈曲線型也是有相關性,若呈圖形區(qū)域且分布較亂則不具有相關性?!咀兪接柧殹?1)在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i1,2,n)都在直線yx1上,則這組樣本數(shù)據(jù)的樣本相關系數(shù)為()A1B0CD1(2)已知變量x和y滿足關系y0.1x1,變量y與z正相關。下列結(jié)論中正確的是()Ax與y正相關,x與z負相關Bx與y正相關,x與z正相關Cx與y負相關,x與z負相關Dx與y負相關,x與z正相關解析(1)完全的線性關系,且為負相關,故其相關系數(shù)為1。故選A。(2)由y0.1x1,知x與y負相關,即y隨x的增大而減小,又y與z正相關,所以z隨y的增大而增大,減小而減小,所以z隨x的增大而減小,x與z負相關,故選C。答案(1)A(2)C考點二線性回歸分析【例2】改革開放40年來,全國居民人均可支配收入由171元增加到2.6萬元,中等收入群體持續(xù)擴大。我國貧困人口累計減少7.4億人,貧困發(fā)生率下降94.4個百分點,譜寫了人類反貧困史上的輝煌篇章。某地級市共有200 000名中學生,其中有7%的學生在2017年享受了“國家精準扶貧”政策,在享受“國家精準扶貧”政策的學生中困難程度分為三個等次:一般困難、很困難、特別困難,且人數(shù)之比為532,為進一步幫助這些學生,當?shù)厥姓O立“專項教育基金”,對這三個等次的困難學生每年每人分別補助1 000元、1 500元、2 000元。經(jīng)濟學家調(diào)查發(fā)現(xiàn),當?shù)厝司芍淠晔杖胼^上一年每增加n%,一般困難的學生中有3n%會脫貧,脫貧后將不再享受“精準扶貧”政策,很困難的學生中有2n%轉(zhuǎn)為一般困難學生,特別困難的學生中有n%轉(zhuǎn)為很困難學生。現(xiàn)統(tǒng)計了該地級市2013年到2017年共5年的人均可支配年收入,對數(shù)據(jù)初步處理后得到了如圖所示的散點圖和表中統(tǒng)計量的值,其中年份x取13時代表2013年,x取14時代表2014年,依此類推,且x與y(單位:萬元)近似滿足關系式x,(2013年至2019年該市中學生人數(shù)大致保持不變)(yi)2(xi)(yi)0.83.11(1)估計該市2018年人均可支配年收入為多少萬元?(2)試問該市2018年的“專項教育基金”的財政預算大約為多少萬元?附:對于一組具有線性相關關系的數(shù)據(jù)(u1,v1),(u2,v2),(un,vn),其回歸直線方程u的斜率和截距的最小二乘估計分別為,。解(1)因為(1314151617)15,所以(xi)2(2)2(1)2122210,所以0.1,0.80.1150.7,所以0.1x0.7。當x18時,2018年人均可支配年收入y0.1180.71.1(萬元)。(2)由題意知2017年時該市享受“國家精準扶貧”政策的學生共200 0007%14 000人。一般困難、很困難、特別困難的中學生依次有7 000人、4 200人、2 800人,2018年人均可支配年收入比2017年增長0.110%。故2018年該市特別困難的中學生有2 800(110%)2 520人,很困難的學生有4 200(120%)2 80010%3 640人,一般困難的學生有7 000(130%)4 20020%5 740人。所以2018年的“專項教育基金”的財政預算大約為5 7400.13 6400.152 5200.21 624(萬元)。1對變量值的預測主要是由給出的變量的值預測與其有相關關系的變量的值,一般方法是:若已知回歸直線方程,則直接將數(shù)值代入求得預測值。2回歸模型的擬合效果主要有兩種途徑判斷(1)利用數(shù)據(jù)的散點圖,觀察數(shù)據(jù)對應的點與回歸直線的位置關系進行分析;(2)利用殘差進行分析,最簡單的作法是選擇數(shù)據(jù)中的具有代表性的點進行預報,比較預報值與真實值的差距進行分析?!咀兪接柧殹?2018全國卷)如圖是某地區(qū)2000年至2016年環(huán)境基礎設施投資額y(單位:億元)的折線圖。為了預測該地區(qū)2018年的環(huán)境基礎設施投資額,建立了y與時間變量t的兩個線性回歸模型。根據(jù)2000年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,17)建立模型:30.413.5t;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,7)建立模型:9917.5t。(1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎設施投資額的預測值;(2)你認為用哪個模型得到的預測值更可靠?并說明理由。解(1)利用模型,該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為30.413.519226.1(億元)。利用模型,該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為9917.59256.5(億元)。(2)利用模型得到的預測值更可靠。理由如下:a從折線圖可以看出,2000年至2016年的數(shù)據(jù)對應的點沒有隨機散布在直線30.413.5t上下,這說明利用2000年至2016年的數(shù)據(jù)建立的線性模型不能很好地描述環(huán)境基礎設施投資額的變化趨勢。2010年相對2009年的環(huán)境基礎設施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對應的點位于一條直線的附近,這說明從2010年開始環(huán)境基礎設施投資額的變化規(guī)律呈線性增長趨勢,利用2010年至2016年的數(shù)據(jù)建立的線性模型9917.5t可以較好地描述2010年以后的環(huán)境基礎設施投資額的變化趨勢,因此利用模型得到的預測值更可靠。b從計算結(jié)果看,相對于2016年的環(huán)境基礎設施投資額220億元,由模型得到的預測值226.1億元的增幅明顯偏低,而利用模型得到的預測值的增幅比較合理,說明利用模型得到的預測值更可靠。以上2種理由,答出其中一種或其他合理理由均可??键c三獨立性檢驗【例3】(2018全國卷)某工廠為提高生產(chǎn)效率,開展技術創(chuàng)新活動,提出了完成某項生產(chǎn)任務的兩種新的生產(chǎn)方式。為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機分成兩組,每組20人。第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式。根據(jù)工人完成生產(chǎn)任務的工作時間(單位:min)繪制了如圖所示的莖葉圖:(1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說明理由;(2)求40名工人完成生產(chǎn)任務所需時間的中位數(shù)m,并將完成生產(chǎn)任務所需時間超過m和不超過m的工人數(shù)填入下面的列聯(lián)表:超過m不超過m第一種生產(chǎn)方式第二種生產(chǎn)方式(3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認為兩種生產(chǎn)方式的效率有差異?附:K2,P(K2k)0.0500.0100.001k3.8416.63510.828解(1)第二種生產(chǎn)方式的效率更高。理由如下:由莖葉圖可知:用第一種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務所需時間至少80分鐘,用第二種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務所需時間至多79分鐘。因此第二種生產(chǎn)方式的效率更高。由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間的中位數(shù)為85.5分鐘,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間的中位數(shù)為73.5分鐘。因此第二種生產(chǎn)方式的效率更高。由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務平均所需時間高于80分鐘;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務平均所需時間低于80分鐘,因此第二種生產(chǎn)方式的效率更高。由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布在莖8上的最多,關于莖8大致呈對稱分布;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布在莖7上的最多,關于莖7大致呈對稱分布。又用兩種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布的區(qū)間相同,故可以認為用第二種生產(chǎn)方式完成生產(chǎn)任務所需的時間比用第一種生產(chǎn)方式完成生產(chǎn)任務所需的時間更少,因此第二種生產(chǎn)方式的效率更高。以上4種理由,答出其中一種或其他合理理由均可。(2)由莖葉圖知m80。列聯(lián)表如下:超過m不超過m第一種生產(chǎn)方式155第二種生產(chǎn)方式515(3)由于K2106.635,所以有99%的把握認為兩種生產(chǎn)方式的效率有差異。1在22列聯(lián)表中,如果兩個變量沒有關系,則應滿足adbc0。|adbc|越小,說明兩個變量之間關系越弱;|adbc|越大,說明兩個變量之間關系越強。2解決獨立性檢驗的應用問題,一定要按照獨立性檢驗的步驟得出結(jié)論。獨立性檢驗的一般步驟:(1)根據(jù)樣本數(shù)據(jù)制成22列聯(lián)表;(2)根據(jù)公式K2計算K2的觀測值k;(3)比較觀測值k與臨界值的大小關系,作統(tǒng)計推斷。【變式訓練】某省會城市地鐵將于2019年6月開始運營,為此召開了一個價格聽證會,擬定價格后又進行了一次調(diào)查,隨機抽查了50人,他們的收入與態(tài)度如下:月收入(單位:百元)15,25)25,35)35,45)45,55)55,65)65,75贊成定價者人數(shù)123534認為價格偏高者人數(shù)4812521(1)若以區(qū)間的中點值為該區(qū)間內(nèi)的人均月收入,求參與調(diào)查的人員中“贊成定價者”與“認為價格偏高者”的月平均收入的差異是多少(結(jié)果保留2位小數(shù));(2)由以上統(tǒng)計數(shù)據(jù)填下面22列聯(lián)表,分析是否有99%的把握認為“月收入以55百元為分界點對地鐵定價的態(tài)度有差異”。月收入不低于55百元的人數(shù)月收入低于55百元的人數(shù)總計認為價格偏高者贊成定價者總計附:K2。P(K2k0)0.050.01k03.8416.635解(1)“贊成定價者”的月平均收入為x150.56。“認為價格偏高者”的月平均收入為x238.75,所以“贊成定價者”與“認為價格偏高者”的月平均收入的差距是x1x250.5638.7511.81(百元)。(2)根據(jù)條件可得22列聯(lián)表如下:月收入不低于55百元的人數(shù)月收入低于55百元的人數(shù)總計認為價格偏高者32932贊成定價者71118總計104050K26.2726.635,所以沒有99%的把握認為“月收入以55百元為分界點對地鐵定價的態(tài)度有差異”。1(配合例2使用)如圖是某企業(yè)2012年至2018年的污水凈化量(單位:噸)的折線圖。注:年份代碼17分別對應年份20122018。(1)由折線圖看出,可用線性回歸模型擬合y和t的關系,請用相關系數(shù)加以說明;(2)建立y關于t的回歸方程,預測2019年該企業(yè)的污水凈化量;(3)請用數(shù)據(jù)說明回歸方程預報的效果。參考數(shù)據(jù):54,(ti)(yi)21,3.74,(yii)2。參考公式:相關系數(shù)r,線性回歸方程t,。反映回歸效果的公式為:R21,其中R2越接近于1,表示回歸的效果越好。解(1)由折線圖中的數(shù)據(jù)得,4,(ti)228,(yi)218,所以r0.935。因為y與t的相關系數(shù)近似為0.935,說明y與t的線性相關程度相當大,所以可以用線性回歸模型擬合y與t的關系。(2)因為54,所以54451,所以y關于t的線性回歸方程為tt51。將2019年對應的t8代入得85157,所以預測2019年該企業(yè)污水凈化量約為57噸。(3)因為R21110.875,所以“污水凈化量的差異”有87.5%是由年份引起的,這說明回歸方程預報的效果是良好的。2(配合例3使用)近代統(tǒng)計學的發(fā)展起源于二十世紀初,它是在概率論的基礎上發(fā)展起來的,統(tǒng)計性質(zhì)的工作則可以追溯到遠古的“結(jié)繩記事”和二十四史中大量的關于我國人口、錢糧、水文、天文、地震等資料的記錄。近幾年,霧霾來襲,對某市該年11月份的天氣情況進行統(tǒng)計,結(jié)果如下表:表一日期123

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論