分類(lèi)變量與列聯(lián)表高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第1頁(yè)
分類(lèi)變量與列聯(lián)表高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第2頁(yè)
分類(lèi)變量與列聯(lián)表高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第3頁(yè)
分類(lèi)變量與列聯(lián)表高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第4頁(yè)
分類(lèi)變量與列聯(lián)表高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

8.3列聯(lián)表與獨(dú)立性檢驗(yàn)1、理解獨(dú)立性檢驗(yàn)的基本思想及其實(shí)施步驟.2、能利用等高堆積條形圖、2×2列聯(lián)表探討兩個(gè)分類(lèi)變量的關(guān)聯(lián).3、了解隨機(jī)變量χ2的含義及作用.4、通過(guò)對(duì)數(shù)據(jù)的處理,提高解決實(shí)際問(wèn)題的能力.學(xué)習(xí)目標(biāo)吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn)?就讀不同學(xué)校是否對(duì)學(xué)生的成績(jī)有影響?不同班級(jí)學(xué)生用于體育鍛煉的時(shí)間是否有差別?研究?jī)蓚€(gè)分類(lèi)變量之間是否有關(guān)系,或者說(shuō)是否獨(dú)立的問(wèn)題——獨(dú)立性檢驗(yàn)在研究上述問(wèn)題時(shí),為了表述方便,我們經(jīng)常會(huì)使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類(lèi)隨機(jī)變量稱(chēng)為分類(lèi)變量.分類(lèi)變量是說(shuō)明事物類(lèi)別的一個(gè)名稱(chēng),其取值是分類(lèi)數(shù)據(jù).分類(lèi)變量的取值可以用實(shí)數(shù)表示,在很多時(shí)候,這些數(shù)值只作為編號(hào)使用,并沒(méi)有通常的大小和運(yùn)算意義.前面兩節(jié)所討論的變量,如人的身高等,都是數(shù)值變量,數(shù)值變量的取值為實(shí)數(shù).其大小和運(yùn)算都有實(shí)際含義.性別數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀優(yōu)秀甲校乙校合計(jì)在實(shí)踐中,由于保存原始數(shù)據(jù)的成本較高,人們經(jīng)常按研究問(wèn)題的需要,將數(shù)據(jù)分類(lèi)統(tǒng)計(jì),并做成表格加以保存,我們將上表這種形式的數(shù)據(jù)統(tǒng)計(jì)表稱(chēng)為2×2列聯(lián)表(contingencytable).將題目中的數(shù)據(jù)直觀用表格呈現(xiàn)33104338745711788為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過(guò)測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀,試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.實(shí)例用表中各類(lèi)變量的頻率分析:

性別數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀優(yōu)秀甲校331043乙校38745合計(jì)711788為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過(guò)測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀,試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.實(shí)例用等高堆積條形圖直觀地展示甲校學(xué)生數(shù)學(xué)成績(jī)的優(yōu)秀率比乙校學(xué)生的高圖形分析法:與表格相比,圖形更能直觀地反映出兩個(gè)分類(lèi)變量間是否互相影響,常用等高堆積條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.將列聯(lián)表中的數(shù)據(jù)用高度相同的兩個(gè)條形圖表示出來(lái),其中兩列的數(shù)據(jù)分別對(duì)應(yīng)不同的顏色,這就是等高堆積條形圖.兩個(gè)分類(lèi)變量之間關(guān)聯(lián)關(guān)系的定性分析的方法定義一對(duì)分類(lèi)變量X和Y,我們整理數(shù)據(jù)有2×2列聯(lián)表

總計(jì)cae23d48

總計(jì)b78121A.54,43B.53,43C.53,42 D.54,42B觀察如圖所示的等高條形圖,其中最有把握認(rèn)為兩個(gè)分類(lèi)變量x,y之間有關(guān)系的是(

)ABCDD現(xiàn)行普通高中學(xué)生在高一時(shí)面臨著選科的問(wèn)題,學(xué)校抽取了部分男?女學(xué)生意愿的一份樣本,制作出如下兩個(gè)等高堆積條形圖,根據(jù)這兩幅圖中的信息,下列哪個(gè)統(tǒng)計(jì)結(jié)論是不正確的(

)DA.樣本中的女生數(shù)量多于男生數(shù)量B.樣本中有兩理一文意愿的學(xué)生數(shù)量多于

有兩文一理意愿的學(xué)生數(shù)量C.樣本中的男生偏愛(ài)兩理一文D.樣本中的女生偏愛(ài)兩文一理由于數(shù)據(jù)的隨機(jī)性,這一推斷有可能是錯(cuò)誤的!那么犯錯(cuò)誤的概率有多大呢?如何從概率的角度去研究?jī)蓚€(gè)分類(lèi)變量X和Y是否有關(guān)聯(lián)?將問(wèn)題數(shù)學(xué)化,嘗試用數(shù)學(xué)語(yǔ)言描述一下兩個(gè)分類(lèi)變量是否有關(guān)聯(lián).事件{Y=1}與事件{X=1}或事件{X=0}是否有關(guān)聯(lián).概率語(yǔ)言從集合{X=0}中隨機(jī)先取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=0,Y=1}的概率從集合{X=1}中隨機(jī)選取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=1,Y=1}的概率

判定根據(jù)條件概率的計(jì)算方法不同學(xué)校對(duì)數(shù)學(xué)成績(jī)沒(méi)有影響P(Y=1|X=0)=P(Y=1|X=1)不同學(xué)校對(duì)數(shù)學(xué)成績(jī)有影響P(Y=1|X=0)≠P(Y=1|X=1)判斷依據(jù)性別數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計(jì)711788P(Y=1|X=0)>P(Y=1|X=1)故兩個(gè)不同的學(xué)校對(duì)數(shù)學(xué)成績(jī)是有影響的在統(tǒng)計(jì)中:構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,對(duì)成對(duì)的分類(lèi)變量X和Y是否相互獨(dú)立作出推斷由條件概率的定義可知,零假設(shè)H0:P(Y=1|X=0)=P(Y=1|X=1)或P(X=0,Y=1)P(X=1)=P(X=1,Y=1)P(X=0)①P(X=0,Y=0)=P(X=0)P(Y=0);P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0);P(X=1,Y=1)=P(X=1)P(Y=1).②{X=0}與{Y=0}獨(dú)立;{X=0}與{Y=1}獨(dú)立;{X=1}與{Y=0}獨(dú)立;{X=1}與{Y=1}獨(dú)立.由于分類(lèi)變量之間結(jié)合列聯(lián)表中的數(shù)據(jù)可得綜合②中的四個(gè)式子,如果零假設(shè)H0成立,下面四個(gè)量的取值都不應(yīng)該太大:

反之,當(dāng)這些量的取值較大時(shí),就可以推斷H0不成立.化簡(jiǎn)得將四個(gè)差的絕對(duì)值取平方后分別除以相應(yīng)的期望值再求和

決定了卡方值的大小

小概率事件在一次試驗(yàn)中不大可能發(fā)生依據(jù):獨(dú)立性檢驗(yàn)臨界值表:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828獨(dú)立性檢驗(yàn)的基本思想:類(lèi)似于數(shù)學(xué)的反證法,要確認(rèn)“兩個(gè)分類(lèi)變量有關(guān)系”這一結(jié)論成立的可信程度,①首先,假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個(gè)分類(lèi)變量沒(méi)有關(guān)系”成立。②其次,計(jì)算構(gòu)造的隨機(jī)變量K2,如果由觀測(cè)數(shù)據(jù)計(jì)算得到的k很大,則在一定程度上說(shuō)明假設(shè)不合理。③最后,根據(jù)隨機(jī)變量K2的含義,利用P(K2≥k0)的值評(píng)價(jià)假設(shè)不合理的程度。(k0叫臨界值)χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值.我們推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)0.05;(2)當(dāng)χ2<x0.05=3.841時(shí),我們沒(méi)有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立,即兩類(lèi)變量沒(méi)影響例如:對(duì)于小概率值α=0.05,我們有如下的具體檢測(cè)規(guī)則:(1)當(dāng)χ2≥x0.05=3.841時(shí),α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過(guò)測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀,試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.

學(xué)校數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀優(yōu)秀甲校331043乙校38745合計(jì)711788由題意得2×2列聯(lián)表由表中數(shù)據(jù),計(jì)算得到:故可以認(rèn)為H0成立即認(rèn)為兩校的數(shù)學(xué)成績(jī)優(yōu)秀率沒(méi)有差異012×2列聯(lián)表03

計(jì)算卡方04確定臨界值,如:犯錯(cuò)誤的概率不會(huì)超過(guò)0.01.獨(dú)立性檢驗(yàn)的一般步驟學(xué)校數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀優(yōu)秀甲校乙校合計(jì)02

設(shè)05給出推斷結(jié)果及其解釋H0的反面成立】

解:

在一項(xiàng)中學(xué)生近視情況的調(diào)查中,某校男生150名中有80名近視,女生140名中有70名近視,在檢驗(yàn)這些中學(xué)生眼睛近視是否與性別有關(guān)時(shí)用什么方法最有說(shuō)服力(

)A.平均數(shù)與方差 B.回歸分析C.獨(dú)立性檢驗(yàn) D.概率C分類(lèi)變量X和Y的列表如下,則下列說(shuō)法判斷正確的是(

)A.a(chǎn)d-bc越小,說(shuō)明X和Y關(guān)系越弱B.a(chǎn)d-bc越大,說(shuō)明X和Y關(guān)系越強(qiáng)C.(ad-bc)2越大,說(shuō)明X與Y關(guān)系越強(qiáng)D.(ad-bc)2越接近于0,說(shuō)明X與Y關(guān)系越強(qiáng)C

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論