2026版正禾一本通高三一輪總復(fù)習(xí)數(shù)學(xué)(北師版)-第九章_第1頁
2026版正禾一本通高三一輪總復(fù)習(xí)數(shù)學(xué)(北師版)-第九章_第2頁
2026版正禾一本通高三一輪總復(fù)習(xí)數(shù)學(xué)(北師版)-第九章_第3頁
2026版正禾一本通高三一輪總復(fù)習(xí)數(shù)學(xué)(北師版)-第九章_第4頁
2026版正禾一本通高三一輪總復(fù)習(xí)數(shù)學(xué)(北師版)-第九章_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

9.1隨機抽樣、統(tǒng)計圖表[課標(biāo)要求]1.了解獲取數(shù)據(jù)的基本途徑.2.會用簡單隨機抽樣的方法從總體中抽取樣本,了解分層隨機抽樣.3.能根據(jù)實際問題的特點選擇恰當(dāng)?shù)慕y(tǒng)計圖表,體會使用統(tǒng)計圖表的重要性.【必備知識】1.統(tǒng)計的有關(guān)概念名稱定義全面調(diào)查(普查)對每一個調(diào)查對象都進行調(diào)查的方法總體在一個調(diào)查中,把調(diào)查對象的全體稱為總體個體組成總體的每一個調(diào)查對象抽樣調(diào)查根據(jù)一定目的,從總體中抽取一部分個體進行調(diào)查,并以此為依據(jù)對總體的情況作出估計和推斷的調(diào)查方法樣本從總體中抽取的那部分個體樣本量樣本中包含的個體數(shù)2.簡單隨機抽樣抽簽法和隨機數(shù)法是比較常用的兩種方法.3.分層隨機抽樣(1)分層隨機抽樣的概念將總體按其屬性特征分成互不交叉的若干類型(有時稱作層),然后在每個類型中按照所占比例隨機抽取一定的個體,這種抽樣方法通常叫作分層隨機抽樣.(2)分層隨機抽樣是按比例抽樣,每一層入樣的個體數(shù)為該層的個體數(shù)乘抽樣比.4.統(tǒng)計圖表(1)常見的統(tǒng)計圖表有條形圖、扇形圖、折線圖、頻率分布直方圖等.(2)作頻率分布直方圖的步驟①求極差;②決定組距與組數(shù);③將數(shù)據(jù)分組;④列頻率分布表;⑤畫頻率分布直方圖.【必記結(jié)論】1.利用按比例分配的分層隨機抽樣要注意按比例抽取,若各層應(yīng)抽取的個體數(shù)不都是整數(shù),可以進行一定的技術(shù)處理,比如將結(jié)果取成整數(shù)等.2.在按比例分配的分層隨機抽樣中,以層數(shù)是2層為例,如果第1層和第2層包含的個體數(shù)分別為M和N,抽取的樣本量分別為m和n,第1層和第2層的樣本平均數(shù)分別為x,y,樣本平均數(shù)為w,則3.頻率分布直方圖中小長方形高=頻率組距【基點診斷】1.判斷下列說法正誤(在括號內(nèi)打“√”或“×”)(1)在簡單隨機抽樣中,某一個個體被抽到的可能性與第幾次抽取有關(guān),第一次被抽到的可能性最大.()(2)分層抽樣中,每個個體被抽到的可能性與層數(shù)及分層有關(guān).()(3)在分層隨機抽樣的過程中,哪一層的樣本越多,該層中個體被抽到的可能性越大.()(4)在頻率分布直方圖中,小矩形的面積越大,表示樣本數(shù)據(jù)落在該區(qū)間的頻率越大.()答案:(1)×(2)×(3)×(4)√2.為了了解某地參加計算機水平測試的5000名學(xué)生的成績,從中抽取了200名學(xué)生的成績進行調(diào)查分析,在這個問題中,被抽取的200名學(xué)生的成績是()A.總體B.個體C.樣本D.樣本容量解析:選C.總體:5000名學(xué)生的成績;個體:每個學(xué)生的成績;樣本:200名學(xué)生的成績;樣本容量:200.所以抽取的200名學(xué)生的成績是樣本.3.(多選)(人教A版必修二·P199例1改編)空氣質(zhì)量指數(shù)AQI是反映空氣質(zhì)量狀況的指數(shù),AQI指數(shù)的值越小,表明空氣質(zhì)量越好.AQI指數(shù)不超過50,空氣質(zhì)量為“優(yōu)”;AQI指數(shù)大于50且不超過100,空氣質(zhì)量為“良”;AQI指數(shù)大于100,空氣質(zhì)量為“污染”.下圖是某市2024年空氣質(zhì)量指數(shù)(AQI)的月折線圖.下列關(guān)于該市2024年空氣質(zhì)量的敘述中一定正確的是()某市2024年空氣質(zhì)量指數(shù)(AQI)月折線圖A.全年的平均AQI指數(shù)對應(yīng)的空氣質(zhì)量等級為“優(yōu)”或“良”B.每月都至少有一天空氣質(zhì)量為“優(yōu)”C.2月,8月,9月和12月均出現(xiàn)污染天氣D.空氣質(zhì)量為“污染”的天數(shù)最多的月份是2月份解析:選ABC.每月的平均AQI指數(shù)都不超過100,故全年的平均AQI指數(shù)也不超過100,對應(yīng)的空氣質(zhì)量為“優(yōu)”或“良”,故選項A正確;每月的AQI指數(shù)的最小值均不超過50,故每月都至少有一天空氣質(zhì)量為“優(yōu)”,選項B正確;2月,8月,9月和12月的AQI指數(shù)的最大值均大于100,故至少有一天出現(xiàn)了污染天氣,故選項C正確;2月,8月,9月,12月中空氣質(zhì)量為“污染”的天數(shù)不確定,故選項D不一定正確.4.某田徑隊有男運動員56人,女運動員42人,從中用分層抽樣的方法抽取容量為28的樣本,則男運動員應(yīng)抽______人.解析:運動員一共有98人,設(shè)男運動員應(yīng)抽x人,所以x56=28答案:165.從某小區(qū)隨機抽取100戶居民用戶進行月用電量調(diào)查,發(fā)現(xiàn)他們的月用電量都在50~300kW·h之間,適當(dāng)分組(每組為左閉右開區(qū)間)后繪制成如圖所示的頻率分布直方圖.(1)直方圖中x的值為________;(2)在被調(diào)查的用戶中月用電量落在區(qū)間[100,250)內(nèi)的戶數(shù)為________.解析:(1)根據(jù)頻率分布直方圖的面積和為1,得(0.0024+0.0038+0.0060+x+0.0032)×50=1,解得x=0.0046.(2)月用電量落在區(qū)間[100,250)內(nèi)的頻率為f=(0.0038+0.0060+0.0046)×50=0.72,所以在被調(diào)查的用戶中月用電量落在區(qū)間[100,250)內(nèi)的戶數(shù)為100×0.72=72.答案:(1)0.0046(2)72題型一簡單隨機抽樣【例1】(1)某工廠利用隨機數(shù)法對生產(chǎn)的700個零件進行抽樣測試,先將700個零件進行編號,001,002,…,699,700.從中抽取70個樣本,下面提供了隨機數(shù)表的第5行到第6行數(shù)據(jù),若從隨機數(shù)表中第5行第6列開始向右讀取數(shù)據(jù),則得到的第6個樣本編號是()8442125331345786073625300732862345788907236896080432567808436789535577348994837522535578324577892345A.623B.328C.253D.007解析:選A.從第5行第6列開始向右讀取數(shù)據(jù),第一個數(shù)為253,第二個數(shù)是313,第三個數(shù)是457,下一個數(shù)是860,不符合要求,下一個數(shù)是736,不符合要求,下一個是253,重復(fù),則第四個數(shù)是007,第五個數(shù)是328,第六個數(shù)是623.(2)某小學(xué)三年級共有學(xué)生500名,隨機抽查100名學(xué)生并提問中國古代四大發(fā)明,能說出兩種發(fā)明的有45人,能說出三種及以上發(fā)明的有32人,據(jù)此估計該校三年級500名學(xué)生中,對四大發(fā)明只能說出一種或一種也說不出的有()A.69人B.84人C.108人D.115人解析:選D.在這100名學(xué)生中,只能說出一種或一種也說不出的有100-45-32=23(人),設(shè)該校三年級中對四大發(fā)明只能說出一種或一種也說不出的有x人,則100500=23【對點練習(xí)】1.(1)(多選)下列抽樣方法不是簡單隨機抽樣的是()A.在機器傳送帶上抽取30件產(chǎn)品作為樣本B.從平面直角坐標(biāo)系中抽取5個點作為樣本C.箱子里共有100個零件,從中選取10個零件進行檢驗,在抽樣操作時,每次任意地拿出1個零件進行質(zhì)量檢驗,檢驗后不再把它放回箱子里,直到抽取10個零件為止D.某可樂公司從倉庫中的1000箱可樂中一次性抽取20箱進行質(zhì)量檢查解析:選AB.A不是,因為傳送帶上的產(chǎn)品數(shù)量不確定;B不是,因為個體的數(shù)量無限;C是,因為滿足簡單隨機抽樣的定義;D是,因為一次性抽取和逐個不放回地隨機抽取是等價的.(2)(2024·山東濰坊模擬)某高中學(xué)校共有學(xué)生3600人,為了解某次數(shù)學(xué)文化知識競賽的得分情況,采用分層抽樣的方法從這3600名學(xué)生中抽取一個容量為48的樣本,若從高一、高二、高三抽取的人數(shù)組成一個以4為公差的等差數(shù)列,則該學(xué)校高三年級的學(xué)生人數(shù)為______.解析:設(shè)從高二抽取的人數(shù)為x,則高一抽取的人數(shù)為x-4,高三抽取的人數(shù)為x+4,所以3x=48,解得x=16,所以高三年級抽取了20人,由分層抽樣的概念可知高三年級的學(xué)生人數(shù)為3600×2048答案:1500題型二頻率分布直方圖【例2】某市某月30天對空氣污染指數(shù)的監(jiān)測數(shù)據(jù)如下(主要污染物為可吸入顆粒物):61767056819192917581886710110395917786818382826479868575714945(1)完成頻率分布表;分組頻數(shù)頻率[41,51)[51,61)[61,71)[71,81)[81,91)[91,101)[101,111](2)作出頻率分布直方圖;(3)根據(jù)國家標(biāo)準(zhǔn),污染指數(shù)在0~50之間時,空氣質(zhì)量為優(yōu);在51~100之間時,空氣質(zhì)量為良;在101~150之間時,空氣質(zhì)量為輕度污染;在151~200之間時,空氣質(zhì)量為中度污染.請你依據(jù)所給數(shù)據(jù)和上述標(biāo)準(zhǔn),對該市的空氣質(zhì)量給出一個簡短評價.解:(1)頻率分布表如表所示.分組頻數(shù)頻率[41,51)22[51,61)11[61,71)44[71,81)66[81,91)1010[91,101)55[101,111]22(2)作出頻率分布直方圖,如圖所示.(3)答對下述兩條中的一條即可.一:該市一個月中空氣污染指數(shù)有2天處于優(yōu)的水平,占當(dāng)月天數(shù)的115,有26天處于良的水平,占當(dāng)月天數(shù)的1315,處于優(yōu)或良的天數(shù)共有28天,占當(dāng)月天數(shù)的二:輕度污染有2天,占當(dāng)月天數(shù)的115,污染指數(shù)在80以上的接近輕度污染的天數(shù)有15天,加上處于輕度污染的天數(shù),共有17天,占當(dāng)月天數(shù)的17思維升華頻率分布直方圖的相關(guān)結(jié)論(1)頻率分布直方圖中各小長方形的面積之和為1.(2)頻率分布直方圖中縱軸表示頻率組距,每組樣本的頻率為組距×頻率(3)頻率分布直方圖中每組樣本的頻數(shù)為頻率×總數(shù).【對點練習(xí)】2.某校為了解學(xué)生學(xué)習(xí)的效果,進行了一次摸底考試,從中選取60名學(xué)生的成績,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六組后,得到不完整的頻率分布直方圖如圖所示,觀察圖形,回答下列問題:(1)求分?jǐn)?shù)在區(qū)間[70,80)內(nèi)的頻率,并補全這個頻率分布直方圖;(2)根據(jù)評獎規(guī)則,排名在前10%的學(xué)生可以獲獎,請你估計獲獎的學(xué)生至少需要多少分?解:(1)設(shè)分?jǐn)?shù)在[70,80)內(nèi)的頻率為x,根據(jù)頻率分布直方圖,可得(0.01+0.015+0.02+0.025+0.005)×10+x=1,解得x=0.25,所以分?jǐn)?shù)在[70,80)內(nèi)的頻率為0.25,補全這個頻率分布直方圖,如圖所示.(2)因為分?jǐn)?shù)在區(qū)間[80,90)內(nèi)的頻率為0.25,在區(qū)間[90,100]內(nèi)的頻率為0.05,而0.05<10%<0.25+0.05,設(shè)排名前10%的分界點為90-a,則0.025a+0.005×10=10%,解得a=2,所以排名前10%的分界點為88分,即獲獎的學(xué)生至少需要88分.題型三統(tǒng)計圖表【例3】(1)(多選)根據(jù)某地3月5日到3月15日的每天最高氣溫與最低氣溫數(shù)據(jù)(單位:℃)繪制如下折線圖,那么下列敘述正確的是()A.5號到11號的最低氣溫與日期之間呈線性相關(guān)關(guān)系且為正相關(guān)B.9號的最高氣溫與最低氣溫的差值最大C.最高氣溫的眾數(shù)為27℃D.5號到15號的最低氣溫的極差比最高氣溫的極差大解析:選AC.由5號到11號的最低氣溫的散點分布是從左下到右上可知:最低氣溫與日期之間呈線性相關(guān)關(guān)系且為正相關(guān),故A正確;由圖可知6號的最高氣溫與最低氣溫的差值最大,故B錯誤;最高氣溫27℃出現(xiàn)了兩次,其他數(shù)據(jù)出現(xiàn)了1次,故27℃是最高氣溫的眾數(shù),故C正確;5號到15號的最低氣溫的極差小于15-3=12,5號到15號的最高氣溫的極差約等于27-15=12,故D錯誤.(2)(多選)(2024·合肥模擬)為了解我國農(nóng)業(yè)、農(nóng)村、農(nóng)民的基本情況,將全國第三次農(nóng)業(yè)普查的部分?jǐn)?shù)據(jù)整理得到如下的柱狀圖(單位:%),則()A.東北地區(qū)的四項數(shù)據(jù)均比中部地區(qū)高B.西部地區(qū)的四項數(shù)據(jù)均比其他三個地區(qū)低C.中部地區(qū)的發(fā)展情況相較于西部地區(qū)的發(fā)展較好D.東部地區(qū)的發(fā)展情況相較于其他三個地區(qū)的發(fā)展較好解析:選CD.東北地區(qū)通電的村、通寬帶互聯(lián)網(wǎng)的村、有電子商務(wù)配送站點的村的占比高于中部地區(qū),但通天然氣的村的占比低于中部地區(qū),故A錯誤;西部地區(qū)通電的村、通寬帶互聯(lián)網(wǎng)的村、有電子商務(wù)配送站點的村的占比低于其他三個地區(qū),但通天然氣的村的占比高于其他三個地區(qū),故B錯誤;中部地區(qū)除通天然氣的村的占比低于西部地區(qū),其他三項數(shù)據(jù)均不低于西部地區(qū),故中部地區(qū)的發(fā)展情況相較于西部地區(qū)較好,故C正確;東部地區(qū)除通天然氣的村的占比低于西部地區(qū),其他三項數(shù)據(jù)均不低于其他三個地區(qū),故東部地區(qū)的發(fā)展情況相較于其他三個地區(qū)較好,故D正確.思維升華統(tǒng)計圖表的主要應(yīng)用(1)扇形圖:直觀描述各類數(shù)據(jù)占總數(shù)的比例.(2)折線圖:描述數(shù)據(jù)隨時間的變化趨勢.(3)條形圖和直方圖:直觀描述不同類別或分組數(shù)據(jù)的頻數(shù)和頻率.【對點練習(xí)】3.(1)(多選)(2024·湖北武漢調(diào)研)某市2024年經(jīng)過招商引資后,經(jīng)濟收入較前一年增加了一倍,實現(xiàn)翻番,為更好地了解該市的經(jīng)濟收入的變化情況,統(tǒng)計了該市招商引資前后的年經(jīng)濟收入構(gòu)成比例,得到如下扇形圖:則下列結(jié)論中正確的是()A.招商引資后,工資凈收入較前一年增加B.招商引資后,轉(zhuǎn)移凈收入是前一年的1.25倍C.招商引資后,轉(zhuǎn)移凈收入與財產(chǎn)凈收入的總和超過了該年經(jīng)濟收入的2D.招商引資后,經(jīng)營凈收入較前一年增加了一倍解析:選AD.設(shè)招商引資前經(jīng)濟收入為M,而招商引資后經(jīng)濟收入為2M,則對于A,招商引資前工資凈收入為M×60%=0.6M,而招商引資后的工資凈收入為2M×37%=0.74M,所以工資凈收入增加了,故A正確;對于B,招商引資前轉(zhuǎn)移凈收入為M×4%=0.04M,招商引資后轉(zhuǎn)移凈收入為2M×5%=0.1M,所以招商引資后,轉(zhuǎn)移凈收入是前一年的2.5倍,故B錯誤;對于C,招商引資后,轉(zhuǎn)移凈收入與財產(chǎn)凈收入的總和為0.1M+0.56M=0.66M<25×2M=0.8M,所以招商引資后,轉(zhuǎn)移凈收入與財產(chǎn)凈收入的總和低于該年經(jīng)濟收入的25,故C錯誤;對于D,招商引資前經(jīng)營凈收入為M×30%=0.3M,招商引資后經(jīng)營凈收入為2M×30%=0.6(2)(多選)新能源汽車包括純電動汽車、增程式電動汽車、混合動力汽車、燃料電池電動汽車、氫發(fā)動機汽車等.我國的新能源汽車發(fā)展開始于21世紀(jì)初,近年來發(fā)展迅速,連續(xù)8年產(chǎn)銷量位居世界第一.下面兩圖分別是2017年至2022年我國新能源汽車年產(chǎn)量和占比(占我國汽車年總產(chǎn)量的比例)情況,則()A.2017~2022年我國新能源汽車年產(chǎn)量逐年增加B.2017~2022年我國新能源汽車年產(chǎn)量的極差為626.4萬輛C.2022年我國汽車年總產(chǎn)量超過2700萬輛D.2019年我國汽車年總產(chǎn)量不低于2018年我國汽車年總產(chǎn)量解析:選BC.由圖可知,從2018年到2019年,我國新能源汽車年產(chǎn)量在下降,故A錯;2017~2022年我國新能源汽車年產(chǎn)量的極差為705.8-79.4=626.4(萬輛),故B對;2022年我國汽車年總產(chǎn)量為705.80.2562019年我國汽車年總產(chǎn)量為124.20.048=2587.5(萬輛),2018年我國汽車年總產(chǎn)量為127[課下鞏固精練卷(七十七)]隨機抽樣、統(tǒng)計圖表__________________________________________________________________【基礎(chǔ)鞏固題】1.下列調(diào)查方式合適的是()A.為了了解一批炮彈的殺傷半徑,采用普查的方式B.為了了解一批玉米種子的發(fā)芽率,采用普查的方式C.為了了解一條河流的水質(zhì),采用抽樣調(diào)查的方式D.為了了解一個寢室的學(xué)生(共5個人)每周體育鍛煉的時間,采用抽樣調(diào)查的方式解析:選C.A項,采用普查的方式測試炮彈殺傷半徑,成本較高,不適合,故錯誤;B項,采用普查的方式測試玉米的發(fā)芽率,較為煩瑣且工作量較大,不適合,故錯誤;C項,抽樣調(diào)查了解河流水質(zhì)是正確的;D項,了解5個人的鍛煉時間,適合采用普查,故錯誤.2.在“世界讀書日”前夕,為了了解某地5000名居民某天的閱讀時間,從中抽取了200名居民的閱讀時間進行統(tǒng)計分析.在這個問題中,5000名居民的閱讀時間的全體是()A.總體B.個體C.樣本容量D.從總體中抽取的一個樣本解析:選A.樣本容量是200,抽取的200名居民的閱讀時間是一個樣本,每個居民的閱讀時間就是一個個體,5000名居民的閱讀時間的全體是總體.3.已知某居民小區(qū)戶主人數(shù)和戶主對戶型結(jié)構(gòu)的滿意率分別如圖①和圖②所示,為了解該小區(qū)戶主對戶型結(jié)構(gòu)的滿意程度,用分層隨機抽樣的方法抽取30%的戶主進行調(diào)查,則樣本量和抽取的戶主對四居室滿意的人數(shù)分別為()A.240,18B.200,20C.240,20D.200,18解析:選A.樣本量n=(250+150+400)×30%=240,抽取的戶主對四居室滿意的人數(shù)為150×30%×40%=18.4.(2024·西安模擬)為了解某校今年報考飛行員的學(xué)生的體重情況.將所得的數(shù)據(jù)整理后,作出了頻率分布直方圖(如圖).已知圖中從左到右的前3個小組的頻率之比為1∶2∶3,第1小組的頻數(shù)為4,則某校報考飛行員的學(xué)生總?cè)藬?shù)是()A.40B.32C.28D.24解析:選B.由圖可知后兩個組頻率為(0.013+0.037)×5=0.25,又因為從左到右的前3個小組的頻率之比為1∶2∶3,所以第1小組的頻率為(1-0.25)×11+2+35.在某中學(xué)舉行的環(huán)保知識競賽中,將三個年級參賽學(xué)生的成績進行整理后分為5組,繪制成如圖所示的頻率分布直方圖,圖中從左到右依次為第一、第二、第三、第四、第五小組,已知第二小組的頻數(shù)是40,則成績在80分~100分的學(xué)生人數(shù)是()A.15B.18C.20D.25解析:選A.由頻率分布直方圖知,第二小組的頻率為10×0.040=0.4,所以總?cè)藬?shù)為400.4=100人,又成績在80分~100分的頻率為10×(0.010+0.005)=0.15,所以成績在80分~100分的學(xué)生人數(shù)為100×6.為了比較甲、乙兩名學(xué)生的數(shù)學(xué)學(xué)科素養(yǎng)的各項能力指標(biāo)值(滿分為5分,分值高者為優(yōu)),繪制了如圖所示的六維能力雷達圖,例如圖中甲的數(shù)學(xué)抽象指標(biāo)值為4,乙的數(shù)學(xué)抽象指標(biāo)值為5,則下面敘述錯誤的是()A.甲的邏輯推理能力指標(biāo)值高于乙的邏輯推理能力指標(biāo)值B.甲的直觀想象能力指標(biāo)值高于乙的數(shù)學(xué)建模能力指標(biāo)值C.乙的六維能力指標(biāo)值整體水平高于甲的六維能力指標(biāo)值整體水平D.甲的數(shù)學(xué)運算能力指標(biāo)值高于甲的直觀想象能力指標(biāo)值解析:選D.對于選項A,甲的邏輯推理能力指標(biāo)值為4,高于乙的邏輯推理能力指標(biāo)值為3,故A正確;對于選項B,乙的數(shù)學(xué)建模能力指標(biāo)值為4,甲的直觀想象能力指標(biāo)值為5,所以甲的直觀想象能力指標(biāo)值高于乙的數(shù)學(xué)建模能力指標(biāo)值,故B正確;對于選項C,甲的六維能力指標(biāo)值的平均值為16×(4+3+4+5+3+4)=236,乙的六維能力指標(biāo)值的平均值為16×7.(多選)在100個零件中,有一級品20個,二級品30個,三級品50個,從中抽取20個作為樣本.方法一:采用簡單隨機抽樣的方法,將零件編號00,01,02,…,99,用抽簽法抽取20個.方法二:采用分層隨機抽樣的方法,從一級品中隨機抽取4個,從二級品中隨機抽取6個,從三級品中隨機抽取10個.對于上述問題,下列說法正確的有()A.不論采用哪種抽樣方法,這100個零件中每一個零件被抽到的可能性都是1B.采用不同的方法,這100個零件中每一個零件被抽到的可能性各不相同C.在上述兩種抽樣方法中,方法二抽到的樣本比方法一抽到的樣本更能反映總體特征D.在上述抽樣方法中,方法一抽到的樣本比方法二抽到的樣本更能反映總體的特征解析:選AC.對于A,B,根據(jù)兩種抽樣的特點知,不論哪種抽樣,總體中每個個體入樣的可能性都相等,都是20100對于C,D,由于總體中有差異較明顯的三個層(一級品、二級品和三級品),所以采用分層隨機抽樣的方法抽到的樣本更有代表性,故C正確,D錯誤.8.(多選)(2024·廣東高州模擬)2023年2月28日,國家統(tǒng)計局發(fā)布中華人民共和國2022年國民經(jīng)濟和社會發(fā)展統(tǒng)計公報,如圖是該公報中關(guān)于2018年~2022年國內(nèi)生產(chǎn)總值及其增長速度的統(tǒng)計圖,下列說法正確的是()A.近五年的國內(nèi)生產(chǎn)總值逐年遞增,近三年均已超過1000000億元B.2017年的國內(nèi)生產(chǎn)總值低于800000億元C.近五年的國內(nèi)生產(chǎn)總值增長速度的平均數(shù)為5.26%D.近五年的國內(nèi)生產(chǎn)總值的極差為290926億元解析:選ACD.由統(tǒng)計圖可得2018年~2022年國內(nèi)生產(chǎn)總值分別為919281,986515,1013567,1149237,1210207,增長速度為6.7%,6.0%,2.2%,8.4%,3.0%.對于A,通過數(shù)據(jù)可得近五年的國內(nèi)生產(chǎn)總值逐年遞增,且近三年均已超過1000000億元,故A正確;對于B,2017年的國內(nèi)生產(chǎn)總值為919281÷(1+6.7%)≈861557億元,故B不正確;對于C,近五年的國內(nèi)生產(chǎn)總值增長速度的平均數(shù)為15×9.假設(shè)要檢查某企業(yè)生產(chǎn)的袋裝牛奶的質(zhì)量是否達標(biāo),現(xiàn)從500袋牛奶中抽取60袋進行檢驗,利用隨機數(shù)表抽取樣本時,先將500袋牛奶按000,001,…,499進行編號,如果從隨機數(shù)表第8行第26列的數(shù)開始,按三位數(shù)連續(xù)向右讀取,最先檢驗的5袋牛奶的號碼是(下面摘取了某隨機數(shù)表第7行至第9行)________________.844217533157245506887704744767217633502583921206766301647859169555671998105071851286735807443952387933211解析:根據(jù)隨機數(shù)表法中數(shù)據(jù)的讀取規(guī)則與方法,可得最先檢驗的5袋牛奶的號碼是:169,105,071,286,443.答案:169,105,071,286,44310.(2024·咸陽質(zhì)檢)某高中有300名學(xué)生參加數(shù)學(xué)競賽,其中有三分之一的學(xué)生成績不低于100分,將不低于100分的學(xué)生成績制成頻率分布直方圖(如圖),分組區(qū)間是[100,110),[110,120),[120,130),[130,140),[140,150],現(xiàn)用按比例分配的分層隨機抽樣的方法從這300名學(xué)生中隨機進行抽取若干人,若成績在[120,140)之間的抽取5人,那么應(yīng)從成績在[100,110)間的學(xué)生中抽取的人數(shù)為______.解析:在[120,130)之間的學(xué)生人數(shù)為100×10×0.030=30,在[130,140)之間的學(xué)生人數(shù)為100×10×0.020=20,在[120,140)之間的學(xué)生人數(shù)為50,又用按比例分配的分層隨機抽樣的方法在[120,140)之間的50名學(xué)生中抽取5人,即抽取比例為110,所以應(yīng)從成績在[100,110)間的學(xué)生中抽取的人數(shù)為100×0.2×1答案:2【綜合應(yīng)用題】11.(多選)(2024·吉林長春模擬)某保險公司為客戶定制了5個險種:甲,一年期短險;乙,兩全保險;丙,理財類保險;丁,定期壽險;戊,重大疾病保險.各種保險按相關(guān)約定進行參保與理賠.該保險公司對5個險種的參??蛻暨M行抽樣調(diào)查,得出如下統(tǒng)計圖例,則以下四個選項正確的是()A.18-29周歲人群參??傎M用最少B.30周歲以上的參保人群約占參???cè)巳旱?0%C.54周歲以上的參保人數(shù)最少D.丁險種更受參保人青睞解析:選ACD.由第一個圖可得54周歲及以上的參保人數(shù)最少,占比為1-30%-33%-20%=17%,其余年齡段的參保人數(shù)均比18-29周歲人群參保人數(shù)多,由第二個圖可得,因為20%×4000<17%×6000,所以18-29周歲人群參??傎M用最少,故A、C正確;由第一個圖可得,30周歲以上的參保人群約占參???cè)巳旱?0%,故B錯誤;由第三個圖可得,丁險種參保人群約占參???cè)巳旱?5%,所以最受青睞,故D正確.12.(多選)(2024·安徽皖南八校聯(lián)考)在某市高三年級舉行的一次模擬考試中,某學(xué)科共有20000人參加考試.為了了解本次考試學(xué)生成績情況,從中抽取了部分學(xué)生的成績(成績均為正整數(shù),滿分為100分)作為樣本進行統(tǒng)計,樣本容量為n,按照[50,60),[60,70),[70,80),[80,90),[90,100]的分組作出頻率分布直方圖如圖所示.其中,成績落在區(qū)間[50,60)內(nèi)的人數(shù)為16.則下列結(jié)論正確的是()A.圖中x=0.016B.樣本容量n=1000C.估計該市全體學(xué)生成績的平均分為70.6分D.該市要對成績前25%的學(xué)生授予“優(yōu)秀學(xué)生”稱號,則授予“優(yōu)秀學(xué)生”稱號的學(xué)生考試成績大約至少為77.25分解析:選ACD.對于A,因為(x+0.030+0.040+0.010+0.004)×10=1,解得x=0.016,故A正確;對于B,因為成績落在區(qū)間[50,60)內(nèi)的人數(shù)為16,所以樣本容量n=160.016×10=100,故B錯誤;對于C,學(xué)生成績平均分為0.016×10×55+0.030×10×65+0.040×10×75+0.010×10×85+0.004×10×95=70.6,故C正確;對于D,因為10×(0.004+0.010)+(80-m)×13.將一個總體分為A,B,C三層,其個體數(shù)之比為5∶3∶2.若用分層隨機抽樣的方法抽取容量為100的樣本,則應(yīng)從C中抽取____個個體;若A,B,C三層的樣本的平均數(shù)分別為15,30,20,則樣本的平均數(shù)為________________.解析:因為A,B,C三層個體數(shù)之比為5∶3∶2,又總體中每個個體被抽到的概率相等,所以分層隨機抽樣應(yīng)從C中抽取100×25+3+2=20個個體.樣本的平均數(shù)為w=答案:2020.514.某企業(yè)三月中旬生產(chǎn)A,B,C三種產(chǎn)品共3000件,根據(jù)分層抽樣的結(jié)果,企業(yè)統(tǒng)計員制作了如下的統(tǒng)計表格:產(chǎn)品類型ABC產(chǎn)品數(shù)量(件)1300樣本容量(件)130由于不小心,表格中A,C產(chǎn)品的有關(guān)數(shù)據(jù)已被污染看不清楚,統(tǒng)計員記得A產(chǎn)品的樣本容量比C產(chǎn)品的樣本容量多10,根據(jù)以上信息,可得C的產(chǎn)品數(shù)量是______件.解析:設(shè)樣本容量為x,則x3000×1300=130,所以x=300,所以A產(chǎn)品和C產(chǎn)品在樣本中共有300-130=170(件),設(shè)C產(chǎn)品的樣本容量為y,則y+y+10=170,所以y=80,所以C的產(chǎn)品數(shù)量為3000300答案:80015.某地各項事業(yè)取得令人矚目的成就,以2023年為例,社會固定資產(chǎn)總投資約為3730億元,其中包括中央項目、省屬項目、地(市)屬項目、縣(市)屬項目和其他項目.圖①、圖②分別是這五個項目的投資額不完整的條形圖和扇形圖,請完成下列問題.(1)地(市)屬項目投資額為________億元;(2)在圖②中,縣(市)屬項目部分所占百分比為m%,對應(yīng)的圓心角為β,則m=____,β=____(m,β均取整數(shù)).解析:(1)因為該地社會固定資產(chǎn)總投資約為3730億元,所以地(市)屬項目投資額為3730-(200+530+670+1500)=830(億元).(2)由條形圖可以看出縣(市)屬項目部分總投資為670億元,所以縣(市)屬項目部分所占百分比為m%=6703730×100%≈18%,即m=18,對應(yīng)的圓心角為β≈360°×答案:(1)830(2)1865°9.2用樣本估計總體[課標(biāo)要求]1.能用樣本估計總體的集中趨勢參數(shù)(平均數(shù)、中位數(shù)、眾數(shù)),理解集中趨勢參數(shù)的統(tǒng)計含義.2.能用樣本估計總體的離散程度參數(shù)(標(biāo)準(zhǔn)差、方差、極差),理解離散程度參數(shù)的統(tǒng)計含義.3.能用樣本估計總體的取值規(guī)律.4.結(jié)合實例,能用樣本估計百分位數(shù),理解百分位數(shù)的統(tǒng)計含義.5.會計算簡單隨機抽樣的樣本均值和樣本方差,掌握分層隨機抽樣的樣本均值和樣本方差.【必備知識】1.百分位數(shù)(1)第p百分位數(shù)的定義一般地,當(dāng)總體是連續(xù)變量時,給定一個百分?jǐn)?shù)p∈(0,1),總體的p分位數(shù)有這樣的特點:總體數(shù)據(jù)中的任意一個數(shù)小于或等于它的可能性是p.(2)計算一組n個數(shù)據(jù)的第p百分位數(shù)的步驟第1步,按照從小到大排列原始數(shù)據(jù).第2步,計算i=n×p.第3步,若i不是整數(shù),大于i的最小整數(shù)為j,則p分位數(shù)為第j項數(shù)據(jù);若i是整數(shù),則p分位數(shù)為第i項與第(i+1)項數(shù)據(jù)的平均數(shù).2.總體集中趨勢的估計數(shù)字特征概念優(yōu)點與缺點眾數(shù)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)眾數(shù)通常用于描述變量的值出現(xiàn)次數(shù)最多的數(shù),但顯然它對其他數(shù)據(jù)信息的忽視使它無法客觀地反映總體特征中位數(shù)把一組數(shù)據(jù)按從小到大順序排列,處在中間位置的一個數(shù)據(jù)(或兩個數(shù)據(jù)的平均數(shù))中位數(shù)等分樣本數(shù)據(jù)所占頻率,它不受少數(shù)幾個極端值的影響,這在某些情況下是優(yōu)點,但它對極端值的不敏感有時也會成為缺點平均數(shù)如果有n個數(shù)據(jù)x1,x2,…,xn,那么這n個數(shù)的平均數(shù)x=x平均數(shù)與每一個樣本數(shù)據(jù)有關(guān),可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響較大,使平均數(shù)在估計總體時可靠性降低3.總體離散程度的估計(1)假設(shè)一組數(shù)據(jù)是x1,x2,…,xn,用x表示這組數(shù)據(jù)的平均數(shù),那么這n個數(shù)的①標(biāo)準(zhǔn)差s=1n②方差s2=1n[x1?x2+x2(2)分層隨機抽樣的均值與方差分層隨機抽樣中,如果樣本量是按比例分配,記總的樣本平均數(shù)為ω,樣本方差為s2.以分兩層抽樣的情況為例.假設(shè)第一層有m個數(shù),分別為x1,x2,…,xm,平均數(shù)為x,方差為s12;第二層有n個數(shù),分別為y1,y2,…,yn則①ω=②s2=1m+n{m[s12+x?ω【必記結(jié)論】1.若數(shù)據(jù)x1,x2,…,xn的平均數(shù)為x,則mx1+a,mx2+a2.?dāng)?shù)據(jù)x1,x2,…,xn與數(shù)據(jù)x1'=x1+a,x′2=x2+a,…,x′n=xn+3.若數(shù)據(jù)x1,x2,…,xn的方差為s2,則數(shù)據(jù)ax1+b,ax2+b,…,axn+b的方差為a2s2.【基點診斷】1.判斷下列說法正誤(在括號內(nèi)打“√”或“×”)(1)對一組數(shù)據(jù)來說,平均數(shù)和中位數(shù)總是非常接近.()(2)在頻率分布直方圖中,最高的小長方形底邊中點的橫坐標(biāo)是眾數(shù).()(3)一組數(shù)據(jù)的眾數(shù)可以是一個或幾個,那么中位數(shù)也具有相同的結(jié)論.()(4)如果一組數(shù)中每個數(shù)減去同一個非零常數(shù),則這組數(shù)的平均數(shù)改變,方差不變.()答案:(1)×(2)√(3)×(4)√2.某機構(gòu)調(diào)查了解10種食品的卡路里含量,結(jié)果如下:107,135,138,140,146,175,179,182,191,195.則這組數(shù)據(jù)的第25百分位數(shù)和中位數(shù)分別是()A.138,160.5 B.138,146C.138,175 D.135,160.5解析:選A.將10個數(shù)按從小到大排列:107,135,138,140,146,175,179,182,191,195,而10×25%=2.5,為第3項138;中位數(shù)為146+17523.設(shè)一組數(shù)據(jù)x1,x2,…,xn的方差為0.1,則數(shù)據(jù)2x1,2x2,2x3,…,2xn的方差為()A.0.1B.0.2C.0.4D.2解析:選C.由方差公式的推廣,知數(shù)據(jù)2x1,2x2,2x3,…,2xn的方差為22×0.1=4×0.1=0.4.4.(多選)在去年的足球聯(lián)賽上,一隊每場比賽平均失球個數(shù)是1.5,全年比賽失球個數(shù)的標(biāo)準(zhǔn)差是1.1;二隊每場比賽平均失球個數(shù)是2.1,全年比賽失球個數(shù)的標(biāo)準(zhǔn)差是0.4.則下列說法正確的有()A.平均來說一隊比二隊防守技術(shù)好B.二隊很少失球C.一隊有時表現(xiàn)差,有時表現(xiàn)又非常好D.二隊比一隊技術(shù)水平更穩(wěn)定解析:選ACD.對于A,因為一隊每場比賽平均失球數(shù)是1.5,二隊每場比賽平均失球數(shù)是2.1,所以平均來說一隊比二隊防守技術(shù)好,故A正確;對于B,因為二隊每場比賽平均失球數(shù)是2.1,全年比賽失球個數(shù)的標(biāo)準(zhǔn)差為0.4,所以二隊經(jīng)常失球,故B錯誤;對于C,因為一隊全年比賽失球個數(shù)的標(biāo)準(zhǔn)差為1.1,二隊全年比賽失球個數(shù)的標(biāo)準(zhǔn)差為0.4,所以一隊有時表現(xiàn)很差,有時表現(xiàn)又非常好,故C正確;對于D,因為一隊全年比賽失球個數(shù)的標(biāo)準(zhǔn)差為1.1,二隊全年比賽失球個數(shù)的標(biāo)準(zhǔn)差為0.4,所以二隊比一隊技術(shù)水平更穩(wěn)定,故D正確.5.四名同學(xué)各擲骰子5次,分別記錄每次骰子出現(xiàn)的點數(shù),根據(jù)四名同學(xué)的統(tǒng)計結(jié)果,可以判斷出一定沒有出現(xiàn)點數(shù)6的是()A.平均數(shù)為2,方差為3.1 B.中位數(shù)為3,方差為1.6C.中位數(shù)為3,眾數(shù)為2 D.平均數(shù)為3,中位數(shù)為2解析:選A.對于A,若平均數(shù)為2,出現(xiàn)點數(shù)6,可得方差s2>15(6-2)2對于B,當(dāng)投擲骰子出現(xiàn)的結(jié)果為3,3,3,5,6時,滿足中位數(shù)為3,方差為s2=15[(3-4)2+(3-4)2+(3-4)2+(5-4)2+(6-4)2對于C,當(dāng)投擲骰子出現(xiàn)結(jié)果為2,2,3,4,6時,滿足中位數(shù)為3,眾數(shù)為2,可以出現(xiàn)點數(shù)6,故C錯誤;對于D,當(dāng)投擲骰子出現(xiàn)的結(jié)果為1,1,2,5,6時,滿足平均數(shù)為3,中位數(shù)為2,可以出現(xiàn)點數(shù)6,故D錯誤.題型一樣本的數(shù)字特征的估計·教考銜接·鏈接高考·【例1】(2024·新課標(biāo)Ⅱ卷)某農(nóng)業(yè)研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的畝產(chǎn)量(單位:kg)并整理得下表:畝產(chǎn)量[900,950)[950,1000)[1000,1050)頻數(shù)61218畝產(chǎn)量[1050,1100)[1100,1150)[1150,1200)頻數(shù)302410根據(jù)表中數(shù)據(jù),下列結(jié)論中正確的是()A.100塊稻田畝產(chǎn)量的中位數(shù)小于1050kgB.100塊稻田中畝產(chǎn)量低于1100kg的稻田所占比例超過80%C.100塊稻田畝產(chǎn)量的極差介于200kg至300kg之間D.100塊稻田畝產(chǎn)量的平均值介于900kg至1000kg之間解析:選C.對于A,因為前3組的頻率之和0.06+0.12+0.18=0.36<0.5,前4組的頻率之和0.36+0.30=0.66>0.5,所以100塊稻田畝產(chǎn)量的中位數(shù)所在的區(qū)間為[1050,1100),故A不正確;對于B,100塊稻田中畝產(chǎn)量低于1100kg的稻田所占比例為6+12+18+30100×100%=66%,故B不正確;對于C,因為1200-900=300,1150-950=200,所以100塊稻田畝產(chǎn)量的極差介于200kg至300kg之間,故C正確;對于D,100塊稻田畝產(chǎn)量的平均值約為1100×(925×6+975×12+1025×18+1075×30+1125×24+1175教材溯源·(人教A版必修第二冊P206例5)某學(xué)校要定制高一年級的校服,學(xué)生根據(jù)廠家提供的參考身高選擇校服規(guī)格.據(jù)統(tǒng)計,高一年級女生需要不同規(guī)格校服的頻數(shù)如下表所示.校服規(guī)格155160165170175合計頻數(shù)39641679026386如果用一個量來代表該校高一年級女生所需校服的規(guī)格,那么在中位數(shù)、平均數(shù)和眾數(shù)中,哪個量比較合適?試討論用表中的數(shù)據(jù)估計全國高一年級女生校服規(guī)格的合理性.解:為了更直觀地觀察數(shù)據(jù)特征,我們用條形圖來表示表中的數(shù)據(jù)(如圖所示).可以發(fā)現(xiàn),選擇校服規(guī)格為“165”的女生的頻數(shù)最高,所以用眾數(shù)165作為該校高一年級女生校服的規(guī)格比較合適.由于全國各地高一年級女生的身高存在一定的差異,所以用一個學(xué)校的數(shù)據(jù)估計全國高一年級女生的校服規(guī)格不合理.【對點練習(xí)】1.(1)(2024·山東臨沂模擬)一組數(shù)據(jù)按從小到大的順序排列為1,4,m,12,14,21,若該組數(shù)據(jù)的中位數(shù)是極差的35A.4B.6C.8D.12解析:選D.由已知可得極差是:21-1=20,而中位數(shù)是極差的35,即中位數(shù)是12,根據(jù)六個數(shù)的中位數(shù)是:m+122=12,解得m=12.因為6(2)(多選)(2024·商丘模擬)在某次演講比賽中,由兩個評委小組(分別為專業(yè)人士“小組A”和觀眾代表“小組B”)給參賽選手打分,根據(jù)兩個評委小組給同一名選手打分的分值繪制成如圖所示的折線圖,則下列結(jié)論正確的是()A.小組A打分的分值的平均數(shù)為48B.小組B打分的分值的中位數(shù)為66C.小組A打分的分值的極差大于小組B打分的分值的極差D.小組A打分的分值的方差小于小組B打分的分值的方差解析:選ABD.由圖可知,小組A打分的分值的平均數(shù)為19×將小組B打分的分值從小到大排列為36,55,58,62,66,68,68,70,75,所以中位數(shù)為66,故B正確;小組A打分的分值的極差為54-43=11,小組B打分的分值的極差為75-36=39,故C錯誤;小組A打分的分值相對更集中,所以小組A打分的分值的方差小于小組B打分的分值的方差,故D正確.題型二總體集中趨勢的估計【例2】(2024·山東青島模擬)為了解甲、乙兩個班級學(xué)生的物理學(xué)習(xí)情況,從兩個班學(xué)生的物理成績(均為整數(shù))中各隨機抽查20個,得到如圖所示的數(shù)據(jù)圖(用頻率分布直方圖估計總體平均數(shù)時,每個區(qū)間的值均取該區(qū)間的中點值),關(guān)于甲、乙兩個班級的物理成績,下列結(jié)論正確的是()A.甲班眾數(shù)小于乙班眾數(shù)B.乙班成績的第75百分位數(shù)為79C.甲班的中位數(shù)為74D.甲班平均數(shù)大于乙班平均數(shù)估計值解析:選D.由甲、乙兩個班級學(xué)生的物理成績的數(shù)據(jù)圖可知甲班眾數(shù)為79,由頻率分布直方圖無法準(zhǔn)確得出乙班眾數(shù),A錯誤;對于乙班物理成績的頻率分布直方圖,前三個矩形的面積之和為(0.020+0.025+0.030)×10=0.75,故乙班成績的第75百分位數(shù)為80,B錯誤;由甲班物理成績數(shù)據(jù)圖可知,小于79分的數(shù)據(jù)有9個,79分的數(shù)據(jù)有6個,故甲班的中位數(shù)為79,C錯誤;甲班平均數(shù)為x甲=120×(57×2+58+59+67+68×2+69×2+79×6+87+88×2+89+98)=74.8,乙班平均數(shù)估計值為x乙=10×(55×0.02+65×0.025+75×思維升華頻率分布直方圖中的數(shù)字特征(1)眾數(shù):最高矩形的底邊中點的橫坐標(biāo).(2)中位數(shù):中位數(shù)左邊和右邊的矩形的面積和應(yīng)該相等.(3)平均數(shù):平均數(shù)在頻率分布直方圖中等于各組區(qū)間的中點值與對應(yīng)頻率之積的和.【對點練習(xí)】2.某考試機構(gòu)的考生根據(jù)聯(lián)考成績了解自己的學(xué)習(xí)情況,隨機抽取了100名學(xué)生的聯(lián)考數(shù)學(xué)成績作為樣本,并按照分?jǐn)?shù)段[50,70),[70,90),[90,110),[110,130),[130,150]分組,繪制了如圖所示的頻率分布直方圖.(1)求出圖中a的值并估計本次考試的及格率(“及格率”指得分為90分及以上的學(xué)生所占比例);(2)估計該校學(xué)生聯(lián)考數(shù)學(xué)成績的第80百分位數(shù);(3)估計該校學(xué)生聯(lián)考數(shù)學(xué)成績的眾數(shù)、平均數(shù).解:(1)由頻率分布直方圖的性質(zhì),可得(a+0.004+0.013+0.014+0.016)×20=1,解得a=0.003.所以及格率為(0.016+0.014+0.003)×20=0.66=66%.(2)得分在110以下的學(xué)生所占比例為(0.004+0.013+0.016)×20=0.66,得分在130以下的學(xué)生所占比例為0.66+0.014×20=0.94,所以第80百分位數(shù)位于[110,130)內(nèi),由110+20×0.8?0.660.94?0.66(3)由圖可得,眾數(shù)的估計值為100.平均數(shù)的估計值為0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6.題型三總體離散程度的估計角度1方差與標(biāo)準(zhǔn)差的計算【例3】(2023·全國乙卷)某廠為比較甲乙兩種工藝對橡膠產(chǎn)品伸縮率的處理效應(yīng),進行10次配對試驗,每次配對試驗選用材質(zhì)相同的兩個橡膠產(chǎn)品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產(chǎn)品的伸縮率.甲、乙兩種工藝處理后的橡膠產(chǎn)品的伸縮率分別記為xi,yi(i=1,2,…,10),試驗結(jié)果如下:試驗序號i12345678910伸縮率xi545533551522575544541568596548伸縮率yi536527543530560533522550576536記zi=xi-yi(i=1,2,…,10),記z1,z2,…,z10的樣本平均數(shù)為z,樣本方差為s2.(1)求z,s2;(2)判斷甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率是否有顯著提高(如果z≥2解:(1)x=1y=1z=zi=xi-yi的值分別為:9,6,8,-8,15,11,19,18,20,12,故s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2(2)由(1)知:z=11,2所以認(rèn)為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高.角度2分層隨機抽樣的方差與標(biāo)準(zhǔn)差【例4】(人教A版必修二P213)在對樹人中學(xué)高一年級學(xué)生身高的調(diào)查中,采用樣本量比例分配的分層隨機抽樣,如果不知道樣本數(shù)據(jù),只知道抽取了男生23人,其平均數(shù)和方差分別為170.6和12.59,抽取了女生27人,其平均數(shù)和方差分別為160.6和38.62.你能由這些數(shù)據(jù)計算出總樣本的方差,并對高一年級全體學(xué)生的身高方差作出估計嗎?解:把男生樣本記為x1,x2,…,x23,其平均數(shù)記為x,方差記為sx2;把女生樣本記為y1,y2,…,y27,其平均數(shù)記為y,方差記為sy2;把總樣本數(shù)據(jù)的平均數(shù)記為z根據(jù)方差的定義,總樣本方差為s2=150[i=123xi?z2由i=123xi?x=i=1同理可得j=127因此,s2=150[i=123xi?x2+i=123x?z2+j=1由x=170.6,y=160.6,根據(jù)按比例分配分層隨機抽樣總樣本平均數(shù)與各層樣本平均數(shù)的關(guān)系,可得總樣本平均數(shù)為z=把已知的男生、女生樣本平均數(shù)和方差的取值代入①,可得s2=150{23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2我們可以計算出總樣本的方差為51.4862,并據(jù)此估計高一年級學(xué)生身高的總體方差為51.4862.思維升華總體離散程度的估計標(biāo)準(zhǔn)差(方差)反映了數(shù)據(jù)的離散與集中、波動與穩(wěn)定的程度.標(biāo)準(zhǔn)差(方差)越大,數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差(方差)越小,數(shù)據(jù)的離散程度越?。緦c練習(xí)】3.(1)某次視力檢測中,甲班12個人視力檢測數(shù)據(jù)的平均數(shù)是1,方差為1;乙班8個人的視力檢測數(shù)據(jù)的平均數(shù)是1.5,方差為0.25,則這20個人的視力的方差為______.解析:設(shè)甲班12個人視力檢測數(shù)據(jù)分別為xi(i=1,2,…,12),乙班8個人的視力檢測數(shù)據(jù)分別為yi(i=1,2,…,8),由題意知:i=112xi=12,i=112由題意20個人的視力的平均數(shù)為120i=112xi===1答案:0.76(2)(2024·江門模擬)某果園試種了A,B兩個品種的桃樹各10棵,并在桃樹成熟掛果后統(tǒng)計了這20棵桃樹的產(chǎn)量如下表,記A,B兩個品種各10棵產(chǎn)量的平均數(shù)分別為x和y,方差分別為s12和A(單位:kg)60504060708070305090B(單位:kg)40605080805060208070①分別求這兩個品種產(chǎn)量的極差和中位數(shù);②求x,③果園要大面積種植這兩種桃樹中的一種,依據(jù)以上計算結(jié)果分析選種哪個品種更合適,并說明理由.解:①這10棵A品種桃樹的產(chǎn)量從小到大分別為30,40,50,50,60,60,70,70,80,90,這10棵A品種桃樹產(chǎn)量的極差為90-30=60,中位數(shù)為60+602這10棵B品種桃樹產(chǎn)量從小到大分別為20,40,50,50,60,60,70,80,80,80,這10棵B品種桃樹產(chǎn)量的極差為80-20=60,中位數(shù)為60+602②x=1y=1s12=110×[(30-60)2+(40-60)2+(50-60)2+(50-60)2+(60-60)2+(60-60)2+(70-60)2+(70-60)2s22=110×[(20-59)2+(40-59)2+(50-59)2+(50-59)2+(60-59)2+(60-59)2+(70-59)2+(80-59)2③由①可知這兩個品種極差和中位數(shù)都相等,由②可知x>y,s12<[課下鞏固精練卷(七十八)]用樣本估計總體__________________________________________________________________【基礎(chǔ)鞏固題】1.(2024·廣東惠州一模)數(shù)據(jù)68,70,80,88,89,90,96,98的第15百分位數(shù)為()A.69B.70C.75D.96解析:選B.因為8×15%=1.2,根據(jù)百分位數(shù)的定義可知,該數(shù)學(xué)成績的15%分位數(shù)為第2個數(shù)據(jù)70.2.某鞋店試銷一種新款女鞋,銷售情況如表:鞋號3435363738394041日銷量/雙259169532如果你是鞋店經(jīng)理,那么下列統(tǒng)計量中對你來說最重要的是()A.平均數(shù)B.眾數(shù)C.中位數(shù)D.極差解析:選B.鞋店經(jīng)理最關(guān)心的是哪個鞋號的鞋銷量最大,由表可知,鞋號為37的鞋銷量最大,共銷售了16雙,所以這組數(shù)據(jù)最重要的是眾數(shù).3.(2024·天津二模)為了加深師生對黨史的了解,激發(fā)廣大師生知史愛黨、知史愛國的熱情,某校舉辦了“學(xué)黨史、育文化”的黨史知識競賽,并將1000名師生的競賽成績(滿分100分,成績?nèi)≌麛?shù))整理成如圖所示的頻率分布直方圖,估計這組數(shù)據(jù)的第85百分位數(shù)為()分A.84B.85C.86D.87解析:選C.由10×(2a+3a+3a+6a+5a+a)=1,解得a=0.005,所以前4組頻率之和為14×0.005×10=0.7,前5組頻率之和為19×0.005×10=0.95,設(shè)這組數(shù)據(jù)的第85百分位數(shù)為x,則0.7+(x-80)×0.025=0.85,解得x=86.4.(2024·長沙模擬)為調(diào)查某地區(qū)中學(xué)生每天睡眠時間,采用按比例分配的分層隨機抽樣的方法,現(xiàn)抽取初中生800人,其每天睡眠時間的平均數(shù)為9小時,方差為1,抽取高中生1200人,其每天睡眠時間的平均數(shù)為8小時,方差為0.5,則估計該地區(qū)中學(xué)生每天睡眠時間的方差為()A.0.94B.0.96C.0.75D.0.78解析:選A.該地區(qū)中學(xué)生每天睡眠時間的平均數(shù)為8001200+800×9+12005.(2024·四川綿陽模擬)某教育機構(gòu)為調(diào)查中小學(xué)生每日完成作業(yè)的時間,收集了某位學(xué)生100天每天完成作業(yè)的時間,并繪制了如圖所示的頻率分布直方圖(每個區(qū)間均為左閉右開),根據(jù)此直方圖得出了下列結(jié)論,其中正確的是()A.估計該學(xué)生每日完成作業(yè)的時間在2小時至2.5小時的有50天B.估計該學(xué)生每日完成作業(yè)時間超過3小時的概率為0.3C.估計該學(xué)生每日完成作業(yè)時間的中位數(shù)為2.625小時D.估計該學(xué)生每日完成作業(yè)時間的眾數(shù)為2.3小時解析:選C.對于A,該學(xué)生每日完成作業(yè)的時間在2小時至2.5小時的天數(shù)為0.5×0.5×100=25,故A錯誤;對于B,估計該學(xué)生每日完成作業(yè)時間超過3小時的概率為(0.3+0.2+0.1+0.1)×0.5=0.35,故B錯誤;對于C,[1,2,5)的頻率為(0.1+0.3+0.5)×0.5=0.45,[1,3)的頻率為0.45+0.4×0.5=0.65,則該學(xué)生每日完成作業(yè)時間的中位數(shù)為2.5+0.5?0.450.2×對于D,估計該學(xué)生每日完成作業(yè)時間的眾數(shù)為2+2.526.(多選)根據(jù)中國報告大廳對2023年3月~10月全國太陽能發(fā)電量進行監(jiān)測統(tǒng)計,太陽能發(fā)電量(單位:億千瓦時)月度數(shù)據(jù)統(tǒng)計如下表:月份3456發(fā)電量/億千瓦時242.94230.87240.59259.33月份78910發(fā)電量/億千瓦時258.9269.19246.06244.31關(guān)于2023年3月~10月全國太陽能發(fā)電量,下列四種說法正確的是()A.中位數(shù)是259.115B.極差是38.32C.第85百分位數(shù)是259.33D.第25百分位數(shù)是240.59解析:選BC.將數(shù)據(jù)從小到大排序可得230.87,240.59,242.94,244.31,246.06,258.9,259.33,269.19,共8個數(shù)據(jù),所以中位數(shù)是244.31+246.062極差是269.19-230.87=38.32,故B正確;因為8×0.85=6.8,所以第85百分位數(shù)是第7個數(shù),即259.33,故C正確;因為8×0.25=2,所以第25百分位數(shù)是240.59+242.9427.(多選)(2024·潮州模擬)根據(jù)氣象學(xué)上的標(biāo)準(zhǔn),如果連續(xù)5天的日平均氣溫都低于10℃即為入冬.現(xiàn)將連續(xù)5天的日平均氣溫的記錄數(shù)據(jù)(記錄數(shù)據(jù)都是自然數(shù))作為一組樣本,則下列樣本中一定符合入冬指標(biāo)的有()A.平均數(shù)小于4B.平均數(shù)小于4且極差小于或等于3C.平均數(shù)小于4且標(biāo)準(zhǔn)差小于或等于4D.眾數(shù)等于5且極差小于或等于4解析:選BD.舉反例,如0,0,0,0,15,平均數(shù)為3小于4,但不符合入冬標(biāo)準(zhǔn),故A錯誤;假設(shè)有數(shù)據(jù)大于或等于10,由極差小于或等于3知,此組數(shù)據(jù)最小值大于或等于7,與平均值小于4矛盾,故假設(shè)不成立,故B正確;舉反例,如1,1,1,1,11,平均數(shù)為3,且標(biāo)準(zhǔn)差為4,但不符合入冬標(biāo)準(zhǔn),故C錯誤;眾數(shù)等于5且極差小于或等于4時,最大數(shù)不超過9,故D正確.8.(2024·黔西模擬)若樣本數(shù)據(jù)x1,x2,…,x10的標(biāo)準(zhǔn)差為3,則數(shù)據(jù)2x1-1,2x2-1,…,2x10-1的標(biāo)準(zhǔn)差為______.解析:因為樣本數(shù)據(jù)x1,x2,…,x10的標(biāo)準(zhǔn)差為3,故樣本數(shù)據(jù)x1,x2,…,x10的方差為9,則數(shù)據(jù)2x1-1,2x2-1,…,2x10-1的方差為22×9=36,故數(shù)據(jù)2x1-1,2x2-1,…,2x10-1的標(biāo)準(zhǔn)差為6.答案:69.(2024·濟南模擬)某射擊運動員連續(xù)射擊5次,命中的環(huán)數(shù)(環(huán)數(shù)為整數(shù))形成一組數(shù)據(jù),這組數(shù)據(jù)的中位數(shù)為8,唯一的眾數(shù)為9,極差為3,則該組數(shù)據(jù)的平均數(shù)為______.解析:依題意,這組數(shù)據(jù)一共有5個數(shù),中位數(shù)為8,則從小到大排列,8的前面有2個數(shù),后面也有2個數(shù),又唯一的眾數(shù)為9,則有兩個9,其余數(shù)字均只出現(xiàn)一次,則最大數(shù)字為9,又極差為3,所以最小數(shù)字為6,所以這組數(shù)據(jù)為6,7,8,9,9,所以平均數(shù)為6+7+8+9+95答案:7.8【綜合應(yīng)用題】10.現(xiàn)有甲、乙兩組數(shù)據(jù),每組數(shù)據(jù)均由六個數(shù)組成,其中甲組數(shù)據(jù)的平均數(shù)為3,方差為5,乙組數(shù)據(jù)滿足如下條件時,若將這兩組數(shù)據(jù)混合成一組,則關(guān)于新的一組數(shù)據(jù)說法錯誤的是()A.若乙組數(shù)據(jù)的平均數(shù)為3,則新的一組數(shù)據(jù)平均數(shù)為3B.若乙組數(shù)據(jù)的方差為5,則新的一組數(shù)據(jù)方差為5C.若乙組數(shù)據(jù)的平均數(shù)為3,方差為5,則新的一組數(shù)據(jù)方差為5D.若乙組數(shù)據(jù)的平均數(shù)為5,方差為3,則新的一組數(shù)據(jù)方差為5解析:選B.設(shè)甲組數(shù)據(jù)的平均數(shù)為x1,方差為s12,乙組數(shù)據(jù)的平均數(shù)為x2,方差為s22,混合后的新數(shù)據(jù)的平均數(shù)為x對于A,新的一組數(shù)據(jù)平均數(shù)x=6對于B,由于不能確定乙組數(shù)據(jù)的平均數(shù),故由公式s2=612[s12+x對于C,因為乙組數(shù)據(jù)的平均數(shù)為3,方差為5,即x2=3,s22=5,所以x=66+6×3+66+6×3=3,所以s2=612[s1對于D,因為乙組數(shù)據(jù)的平均數(shù)為5,方差為3,即x2=5,s22=3,所以x=66+6×3+66+6×5=4,所以s2=611.(多選)已知數(shù)據(jù)x1,x2,…,x9成公差大于0的等差數(shù)列,若去掉數(shù)據(jù)x5,則()A.極差不變 B.第25百分位數(shù)變大C.平均數(shù)不變 D.方差變小解析:選AC.選項A,根據(jù)極差的定義,原數(shù)據(jù)的極差為x9-x1,去掉x5后的極差為x9-x1,即極差不變,故A正確;選項B,原數(shù)據(jù)的第25百分位數(shù)為x3,去掉x5后的第25百分位數(shù)為12(x2+x3)<x3選項C,原數(shù)據(jù)的平均數(shù)為x=x5,去掉x5后的平均數(shù)為x'=18(x1+…+x4+x6+…+x選項D,原數(shù)據(jù)的方差為s2=19[(x1-x5)2+(x2-x5)2+…+(x9-x5)2],去掉x5后的方差為s′2=18[(x1-x5)2+(x2-x5)2+…+(x4-x5)2+(x6-x5)2+…+(x9-x5)2],故s2<s′12.(多選)2024年7月26日至8月11日在巴黎舉辦了第33屆夏季奧林匹克運動會,為了宣傳奧運精神,某學(xué)校組織了甲、乙兩個社團,利用一周的時間對外進行宣傳,將每天宣傳的次數(shù)繪制成如圖所示的頻數(shù)分布折線圖,則()A.甲社團宣傳次數(shù)的眾數(shù)小于乙社團宣傳次數(shù)的眾數(shù)B.甲社團宣傳次數(shù)的極差大于乙社團宣傳次數(shù)的極差C.甲社團宣傳次數(shù)的平均數(shù)大于乙社團宣傳次數(shù)的平均數(shù)D.甲社團宣傳次數(shù)的方差大于乙社團宣傳次數(shù)的方差解析:選ABD.觀察每天宣傳次數(shù)的頻數(shù)分布折線圖,甲社團宣傳次數(shù)的眾數(shù)、乙社團宣傳次數(shù)的眾數(shù)分別為2,3,A正確;甲社團宣傳次數(shù)的極差、乙社團宣傳次數(shù)的極差分別為3,2,B正確;甲社團宣傳次數(shù)的平均數(shù)x1=2+2+3+2+5+4+3甲社團宣傳次數(shù)的方差s12=17×[3×(2-3)2+2×(3-3)2+(5-3)2+(4-3)2]=87,乙社團宣傳次數(shù)的方差s22=17×[2×(2-3)213.(2024·涼山統(tǒng)考)某校為了提高學(xué)生對體育運動的興趣,舉辦了一場體育知識答題比賽活動,共有1000名學(xué)生參加了此次答題活動.為了解本次比賽的成績,從中抽取了100名學(xué)生的得分(得分均為整數(shù),滿分為100分)進行統(tǒng)計,所有學(xué)生的得分都不低于60分,將這100名學(xué)生的得分進行分組,第一組[60,70),第二組[70,80),第三組[80,90),第四組[90,100](單位:分),得到如下的頻率分布直方圖.(1)求圖中m的值,并估計此次競賽活動學(xué)生得分的中位數(shù);(2)根據(jù)頻率分布直方圖,估計此次競賽活動得分的平均值.若對得分不低于平均值的同學(xué)進行獎勵,請估計參賽的學(xué)生中有多少名學(xué)生獲獎.(以每組中點值作為該組數(shù)據(jù)的代表)解:(1)由頻率分布直方圖知,(m+0.03+0.04+0.02)×10=1,解得m=0.01,設(shè)此次競賽活動學(xué)生得分的中位數(shù)為x0,由數(shù)據(jù)落在[60,80)內(nèi)的頻率為0.4,落在[60,90)內(nèi)的頻率為0.8,可得80<x0<90,由(x0-80)×0.04=0.1,解得x0=82.5,所以估計此次競賽活動學(xué)生得分的中位數(shù)為82.5.(2)由頻率分布直方圖及(1)知,數(shù)據(jù)落在[60,70),[70,80),[80,90),[90,100]的頻率分別為0.1,0.3,0.4,0.2,x=65×0.1+75×0.3+85×0.4+95×0.2=82,此次競賽活動學(xué)生得分不低于82的頻率為0.2+90?8210×0.4=0.52,則1000×所以估計此次競賽活動得分的平均值為82,在參賽的1000名學(xué)生中估計有520名學(xué)生獲獎.9.3統(tǒng)計案例[課標(biāo)要求]1.了解樣本相關(guān)系數(shù)的統(tǒng)計含義,了解樣本相關(guān)系數(shù)與標(biāo)準(zhǔn)化數(shù)據(jù)向量夾角的關(guān)系.會通過相關(guān)系數(shù)比較多組成對數(shù)據(jù)的相關(guān)性.2.了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計意義,了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計方法.3.針對實際問題,會用一元線性回歸模型進行預(yù)測.4.理解2×2列聯(lián)表的統(tǒng)計意義,了解2×2列聯(lián)表獨立性檢驗及其應(yīng)用.【必備知識】1.變量的相關(guān)關(guān)系(1)定義:兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.(2)分類:正相關(guān)和負(fù)相關(guān).(3)線性相關(guān):一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點落在一條直線附近,我們就稱這兩個變量線性相關(guān).2.樣本相關(guān)系數(shù)(1)樣本相關(guān)系數(shù)r=i=1n(2)相關(guān)系數(shù)r的性質(zhì)①當(dāng)r>0時,成對樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時,成對樣本數(shù)據(jù)負(fù)相關(guān);當(dāng)r=0時,成對樣本數(shù)據(jù)無線性相關(guān)關(guān)系.②樣本相關(guān)系數(shù)r的取值范圍為[-1,1].當(dāng)|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強;當(dāng)|r|越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.3.一元線性回歸方程(1)最小二乘法:使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小的方法叫作最小二乘法.(2)一元線性回歸方程:兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其線性回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),則b=i=1nxi?xyi?yi=1nxi?x2=i=1nxiyi?nxyi=1nxi2?nx2,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)),其中,eq\o(b,\s\up6(^))是線性回歸方程的斜率,eq\o(a,\s\up6(^))是在y軸上的截距(3)利用決定系數(shù)R2刻畫回歸效果:R2=1-i=1nyi?yi2(4)殘差:觀測值減去預(yù)測值稱為殘差.4.獨立性檢驗(1)獨立性檢驗的概念利用eq\o(χ,\s\do4())2的取值推斷分類變量X和Y是否獨立的方法稱為eq\o(χ,\s\do4())2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.(2)獨立性檢驗的計算公式eq\o(χ,\s\do4())2=nad?bc2a+bc+d(3)獨立性檢驗基于小概率值α的檢驗規(guī)則是:當(dāng)eq\o(χ,\s\do4())2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨立,該推斷犯錯誤的概率不超過α;當(dāng)eq\o(χ,\s\do4())2<xα?xí)r,我們沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨立.(4)eq\o(χ,\s\do4())2獨立性檢驗中常用的小概率值和相應(yīng)的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828【必記結(jié)論】(1)經(jīng)驗回歸直線過點x,(2)根據(jù)經(jīng)驗回歸方程計算的y值,僅是一個預(yù)報值,不是真實發(fā)生的值.(3)根據(jù)eq\o(χ,\s\do4())2的值可以判斷兩個分類變量有關(guān)的可信程度,若eq\o(χ,\s\do4())2越大,則兩分類變量有關(guān)的把握越大.【基點診斷】1.判斷下列說法正誤(在括號內(nèi)打“√”或“×”)(1)相關(guān)關(guān)系是一種非確定性關(guān)系.()(2)線性回歸直線y=bx+a至少經(jīng)過點(x1,y1),(x2,y2),…,(xn,yn)中的一個點.()(3)相關(guān)系數(shù)越大,樣本數(shù)據(jù)的線性相關(guān)程度越強.()(4)若分類變量X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的eq\o(χ,\s\do4())2的觀測值越?。?)答案:(1)√(2)×(3)×(4)×2.兩個變量的相關(guān)關(guān)系有①正相關(guān),②負(fù)相關(guān),③不相關(guān).下列散點圖從左到右分別反映的變量間的相關(guān)關(guān)系是()A.①②③B.②③①C.②①③D.①③②解析:選D.第一個散點圖中的點是從左下角分布到右上角區(qū)域,正相關(guān);第三個散點圖中的點是從左上角分布到右下角區(qū)域,負(fù)相關(guān);第二個散點圖中的點的分布沒有什么規(guī)律,不相關(guān).3.對于變量Y和變量x的成對樣本觀測數(shù)據(jù),用一元線性回歸模型Y=bx+a+e,Ee=0,DeA.滿足一元線性回歸模型的所有假設(shè)B.不滿足一元線性回歸模型的E(e)=0的假設(shè)C.不滿足一元線性回歸模型的D(e)=σ2假設(shè)D.不滿足一元線性回歸模型的E(e)=0和D(e)=σ2的假設(shè)解析:選C.用一元線性回歸模型Y=bx+a+e,Ee=0,De=σ2得到經(jīng)驗回歸模型y=bx+a,根據(jù)對應(yīng)的殘差圖,殘差的均值E(e4.隨著國家三胎政策的全面放開,為了調(diào)查一線城市和非一線城市的三胎生育意愿,某機構(gòu)用簡單隨機抽樣的方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.三胎生育意愿城市級別合計非一線一線愿生452065不愿生132235合計5842100由eq\o(χ,\s\do4())2=nad?bc2a+bc+da+cb+d,得eq\o(χ,\s\do4())2=100×參照下表:α0.10.050.010.001xα2.7063.8416.63510.828根據(jù)小概率值α=0.01的獨立性檢驗,可以得到的結(jié)論是________________.解析:因為eq\o(χ,\s\do4())2≈9.616>6.635,所以有99%以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”.答案:生育意愿與城市級別有關(guān)5.某地區(qū)醫(yī)院的醫(yī)務(wù)人員統(tǒng)計了該院近五天的棉簽使用情況,具體數(shù)據(jù)如表所示:t(單位:天)第1天第2天第3天第4天第5天y(單位:袋)1524364456根據(jù)以上數(shù)據(jù)發(fā)現(xiàn)y與t呈線性相關(guān),其回歸方程為y=10.2t+a,則估計第8天使用的棉簽袋數(shù)為________.解析:因為t=1+2+3+4+55=3,y=15+24+36+44+56所以a=35-10.2×3=4.4,所以y=10.2t+4.4.當(dāng)t=8時,y=10.2×8+4.4=86.答案:86題型一成對數(shù)據(jù)的相關(guān)性【例1】(1)(2024·天津卷)下列圖中,相關(guān)性系數(shù)最大的是()解析:選A.觀察4幅圖可知,A圖散點分布比較集中,且大體接近某一條直線,線性回歸模型擬合效果比較好,呈現(xiàn)明顯的正相關(guān),值相比于其他3圖更接近1.(2)(多選)某服裝生產(chǎn)商為了解青少年的身高和體重的關(guān)系,在15歲的男生中隨機抽測了10人的身高和體重,數(shù)據(jù)如表所示:編號12345678910身高/cm165168170172173174175177179182體重/kg55896165677075757880由表中數(shù)據(jù)制作成如圖所示的散點圖,由最小二乘法計算得到經(jīng)驗回歸直線l1的方程為y=b1x+a1,樣本相關(guān)系數(shù)為r1,決定系數(shù)為R12;經(jīng)過殘差分析確定(168,89)為離群點(對應(yīng)殘差過大),把它去掉后,再用剩下的9對數(shù)據(jù)計算得到經(jīng)驗回歸直線l2的方程為y=b2x+a2,樣本相關(guān)系數(shù)為r2,決定系數(shù)為A.a(chǎn)1>a2 B.b1>b2C.r1<r2 解析:選AC.身高的平均數(shù)為110×(165+168+170+172+173+174+175+177+179+182)=173.5,因為離群點(168,89)的橫坐標(biāo)168小于平均值173.5,縱坐標(biāo)89相對過大,所以去掉離群點后經(jīng)驗回歸直線的截距變小而斜率變大,所以a1>a2,b1<b2去掉離群點后成對樣本數(shù)據(jù)的線性相關(guān)程度更強,擬合效果會更好,所以r1思維升華判定兩個變量相關(guān)性的方法(1)畫散點圖:若點的分布從左下角到右上角,則兩個變量正相關(guān);若點的分布從左上角到右下角,則兩個變量負(fù)相關(guān).(2)樣本相關(guān)系數(shù):當(dāng)r>0時,正相關(guān);當(dāng)r<0時,負(fù)相關(guān);|r|越接近1,相關(guān)性越強.(3)經(jīng)驗回歸方程:當(dāng)b>0時,正相關(guān);當(dāng)b<0時,負(fù)相關(guān).【對點練習(xí)】1.(多選)對兩組數(shù)據(jù)進行統(tǒng)計后得到的散點圖如圖,關(guān)于其線性相關(guān)系數(shù)的結(jié)論正確的是()A.r1<0 B.r2>1C.r1+r2>0 D.|r1|>|r2|解析:選AC.由散點圖可知,線性相關(guān)系數(shù)r1的圖象表示y與x成負(fù)相關(guān),故-1<r1<0,故A正確;線性相關(guān)系數(shù)r2的圖象表示y與x正相關(guān),故1>r2>0,故B錯誤;因為線性相關(guān)系數(shù)r2的點較線性相關(guān)系數(shù)r1的點密集,故|r2|>|r1|,故r1+r2>0,故C正確,D錯誤.題型二回歸模型角度1一元線性回歸模型【例2】為實施鄉(xiāng)村振興,科技興農(nóng),某村建起了田園綜合體,并從省城請來專家進行技術(shù)指導(dǎo),根據(jù)統(tǒng)計,該田園綜合體西紅柿畝產(chǎn)量的增加量y(千克)與某種液體肥料每畝使用量x(千克)之間的對應(yīng)數(shù)據(jù)如下:x(千克)24568y(千克)300400400400500(1)由上表數(shù)據(jù)可知,可用經(jīng)驗回歸模型擬合y與x的關(guān)系,請計算樣本相關(guān)系數(shù)r并加以說明(若|r|>0.75,則線性相關(guān)程度很高,可用經(jīng)驗回歸模型擬合);(2)求y關(guān)于x的經(jīng)驗回歸方程,并預(yù)測當(dāng)液體肥料每畝使用量為15千克時,西紅柿畝產(chǎn)量的增加量約為多少千克?附:相關(guān)系數(shù)r=i=1n經(jīng)驗回歸方程y=a+bx的斜率和截距的最小二乘估計公式分別為b=i=1nxi?xyi解:(1)由已知數(shù)據(jù)可得x=y(tǒng)=所以i=15xi?xyi?y=(-3)×i=15xii=15yi所以樣本相關(guān)系數(shù)r=i=1=6002所以可用經(jīng)驗回歸模型擬合y與x的關(guān)系.(2)b=i=15a=400-5×30=250,所以經(jīng)驗回歸方程為y=30x+250.當(dāng)x=15時,y=30×15+250=700(千克),即當(dāng)液體肥料每畝使用量為15千克時,西紅柿畝產(chǎn)量的增加量約為700千克.思維升華線性回歸分析問題的類型及解題方法(1)求線性回歸方程①利用公式,求出回歸系數(shù)b,a;②待定系數(shù)法:利用回歸直線過樣本點的中心求系數(shù).(2)利用回歸方程進行預(yù)測,把線性回歸方程看作一次函數(shù),求函數(shù)值.(3)利用回歸直線判斷

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論