




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
8.3列聯(lián)表與獨(dú)立性檢驗(yàn)1、理解獨(dú)立性檢驗(yàn)的基本思想及其實(shí)施步驟.2、能利用等高堆積條形圖、2×2列聯(lián)表探討兩個(gè)分類(lèi)變量的關(guān)聯(lián).3、了解隨機(jī)變量χ2的含義及作用.4、通過(guò)對(duì)數(shù)據(jù)的處理,提高解決實(shí)際問(wèn)題的能力.學(xué)習(xí)目標(biāo)吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn)?就讀不同學(xué)校是否對(duì)學(xué)生的成績(jī)有影響?不同班級(jí)學(xué)生用于體育鍛煉的時(shí)間是否有差別?研究?jī)蓚€(gè)分類(lèi)變量之間是否有關(guān)系,或者說(shuō)是否獨(dú)立的問(wèn)題——獨(dú)立性檢驗(yàn)在研究上述問(wèn)題時(shí),為了表述方便,我們經(jīng)常會(huì)使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類(lèi)隨機(jī)變量稱(chēng)為分類(lèi)變量.分類(lèi)變量是說(shuō)明事物類(lèi)別的一個(gè)名稱(chēng),其取值是分類(lèi)數(shù)據(jù).分類(lèi)變量的取值可以用實(shí)數(shù)表示,在很多時(shí)候,這些數(shù)值只作為編號(hào)使用,并沒(méi)有通常的大小和運(yùn)算意義.前面兩節(jié)所討論的變量,如人的身高等,都是數(shù)值變量,數(shù)值變量的取值為實(shí)數(shù).其大小和運(yùn)算都有實(shí)際含義.性別數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀優(yōu)秀甲校乙校合計(jì)在實(shí)踐中,由于保存原始數(shù)據(jù)的成本較高,人們經(jīng)常按研究問(wèn)題的需要,將數(shù)據(jù)分類(lèi)統(tǒng)計(jì),并做成表格加以保存,我們將上表這種形式的數(shù)據(jù)統(tǒng)計(jì)表稱(chēng)為2×2列聯(lián)表(contingencytable).將題目中的數(shù)據(jù)直觀用表格呈現(xiàn)33104338745711788為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過(guò)測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀,試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.實(shí)例用表中各類(lèi)變量的頻率分析:
性別數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀優(yōu)秀甲校331043乙校38745合計(jì)711788為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過(guò)測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀,試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.實(shí)例用等高堆積條形圖直觀地展示甲校學(xué)生數(shù)學(xué)成績(jī)的優(yōu)秀率比乙校學(xué)生的高圖形分析法:與表格相比,圖形更能直觀地反映出兩個(gè)分類(lèi)變量間是否互相影響,常用等高堆積條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.將列聯(lián)表中的數(shù)據(jù)用高度相同的兩個(gè)條形圖表示出來(lái),其中兩列的數(shù)據(jù)分別對(duì)應(yīng)不同的顏色,這就是等高堆積條形圖.兩個(gè)分類(lèi)變量之間關(guān)聯(lián)關(guān)系的定性分析的方法定義一對(duì)分類(lèi)變量X和Y,我們整理數(shù)據(jù)有2×2列聯(lián)表
總計(jì)cae23d48
總計(jì)b78121A.54,43B.53,43C.53,42 D.54,42B觀察如圖所示的等高條形圖,其中最有把握認(rèn)為兩個(gè)分類(lèi)變量x,y之間有關(guān)系的是(
)ABCDD現(xiàn)行普通高中學(xué)生在高一時(shí)面臨著選科的問(wèn)題,學(xué)校抽取了部分男?女學(xué)生意愿的一份樣本,制作出如下兩個(gè)等高堆積條形圖,根據(jù)這兩幅圖中的信息,下列哪個(gè)統(tǒng)計(jì)結(jié)論是不正確的(
)DA.樣本中的女生數(shù)量多于男生數(shù)量B.樣本中有兩理一文意愿的學(xué)生數(shù)量多于
有兩文一理意愿的學(xué)生數(shù)量C.樣本中的男生偏愛(ài)兩理一文D.樣本中的女生偏愛(ài)兩文一理由于數(shù)據(jù)的隨機(jī)性,這一推斷有可能是錯(cuò)誤的!那么犯錯(cuò)誤的概率有多大呢?如何從概率的角度去研究?jī)蓚€(gè)分類(lèi)變量X和Y是否有關(guān)聯(lián)?將問(wèn)題數(shù)學(xué)化,嘗試用數(shù)學(xué)語(yǔ)言描述一下兩個(gè)分類(lèi)變量是否有關(guān)聯(lián).事件{Y=1}與事件{X=1}或事件{X=0}是否有關(guān)聯(lián).概率語(yǔ)言從集合{X=0}中隨機(jī)先取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=0,Y=1}的概率從集合{X=1}中隨機(jī)選取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=1,Y=1}的概率
判定根據(jù)條件概率的計(jì)算方法不同學(xué)校對(duì)數(shù)學(xué)成績(jī)沒(méi)有影響P(Y=1|X=0)=P(Y=1|X=1)不同學(xué)校對(duì)數(shù)學(xué)成績(jī)有影響P(Y=1|X=0)≠P(Y=1|X=1)判斷依據(jù)性別數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計(jì)711788P(Y=1|X=0)>P(Y=1|X=1)故兩個(gè)不同的學(xué)校對(duì)數(shù)學(xué)成績(jī)是有影響的在統(tǒng)計(jì)中:構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,對(duì)成對(duì)的分類(lèi)變量X和Y是否相互獨(dú)立作出推斷由條件概率的定義可知,零假設(shè)H0:P(Y=1|X=0)=P(Y=1|X=1)或P(X=0,Y=1)P(X=1)=P(X=1,Y=1)P(X=0)①P(X=0,Y=0)=P(X=0)P(Y=0);P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0);P(X=1,Y=1)=P(X=1)P(Y=1).②{X=0}與{Y=0}獨(dú)立;{X=0}與{Y=1}獨(dú)立;{X=1}與{Y=0}獨(dú)立;{X=1}與{Y=1}獨(dú)立.由于分類(lèi)變量之間結(jié)合列聯(lián)表中的數(shù)據(jù)可得綜合②中的四個(gè)式子,如果零假設(shè)H0成立,下面四個(gè)量的取值都不應(yīng)該太大:
反之,當(dāng)這些量的取值較大時(shí),就可以推斷H0不成立.化簡(jiǎn)得將四個(gè)差的絕對(duì)值取平方后分別除以相應(yīng)的期望值再求和
決定了卡方值的大小
小概率事件在一次試驗(yàn)中不大可能發(fā)生依據(jù):獨(dú)立性檢驗(yàn)臨界值表:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828獨(dú)立性檢驗(yàn)的基本思想:類(lèi)似于數(shù)學(xué)的反證法,要確認(rèn)“兩個(gè)分類(lèi)變量有關(guān)系”這一結(jié)論成立的可信程度,①首先,假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個(gè)分類(lèi)變量沒(méi)有關(guān)系”成立。②其次,計(jì)算構(gòu)造的隨機(jī)變量K2,如果由觀測(cè)數(shù)據(jù)計(jì)算得到的k很大,則在一定程度上說(shuō)明假設(shè)不合理。③最后,根據(jù)隨機(jī)變量K2的含義,利用P(K2≥k0)的值評(píng)價(jià)假設(shè)不合理的程度。(k0叫臨界值)χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值.我們推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)0.05;(2)當(dāng)χ2<x0.05=3.841時(shí),我們沒(méi)有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立,即兩類(lèi)變量沒(méi)影響例如:對(duì)于小概率值α=0.05,我們有如下的具體檢測(cè)規(guī)則:(1)當(dāng)χ2≥x0.05=3.841時(shí),α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過(guò)測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀,試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.
學(xué)校數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀優(yōu)秀甲校331043乙校38745合計(jì)711788由題意得2×2列聯(lián)表由表中數(shù)據(jù),計(jì)算得到:故可以認(rèn)為H0成立即認(rèn)為兩校的數(shù)學(xué)成績(jī)優(yōu)秀率沒(méi)有差異012×2列聯(lián)表03
計(jì)算卡方04確定臨界值,如:犯錯(cuò)誤的概率不會(huì)超過(guò)0.01.獨(dú)立性檢驗(yàn)的一般步驟學(xué)校數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀優(yōu)秀甲校乙校合計(jì)02
假
設(shè)05給出推斷結(jié)果及其解釋H0的反面成立】
解:
在一項(xiàng)中學(xué)生近視情況的調(diào)查中,某校男生150名中有80名近視,女生140名中有70名近視,在檢驗(yàn)這些中學(xué)生眼睛近視是否與性別有關(guān)時(shí)用什么方法最有說(shuō)服力(
)A.平均數(shù)與方差 B.回歸分析C.獨(dú)立性檢驗(yàn) D.概率C分類(lèi)變量X和Y的列表如下,則下列說(shuō)法判斷正確的是(
)A.a(chǎn)d-bc越小,說(shuō)明X和Y關(guān)系越弱B.a(chǎn)d-bc越大,說(shuō)明X和Y關(guān)系越強(qiáng)C.(ad-bc)2越大,說(shuō)明X與Y關(guān)系越強(qiáng)D.(ad-bc)2越接近于0,說(shuō)明X與Y關(guān)系越強(qiáng)C
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2026學(xué)年吉林省四平市鐵西區(qū)某中學(xué)高二上學(xué)期開(kāi)學(xué)英語(yǔ)試卷(解析版)
- 2025年河北邢臺(tái)內(nèi)丘縣人力資源和社會(huì)保障局就業(yè)見(jiàn)習(xí)245個(gè)崗位考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解(易錯(cuò)題)
- 2025湖北武漢市中南財(cái)經(jīng)政法大學(xué)教師招錄模擬試卷及答案詳解(全優(yōu))
- 企業(yè)文化建設(shè)方案模板跨行業(yè)
- 2025內(nèi)蒙古鄂爾多斯市水發(fā)燃?xì)庥邢薰菊衅?人模擬試卷及完整答案詳解1套
- 《初中物理力學(xué)平衡原理及其應(yīng)用教案》
- 2025貴州安順學(xué)院高層次人才引進(jìn)考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解(必刷)
- 2025湖南懷化市溆浦縣衛(wèi)健局招聘鄉(xiāng)鎮(zhèn)衛(wèi)生院編外專(zhuān)技人員20人考前自測(cè)高頻考點(diǎn)模擬試題附答案詳解(突破訓(xùn)練)
- 企業(yè)知識(shí)產(chǎn)權(quán)保護(hù)登記及維護(hù)方案
- 2025黑龍江齊齊哈爾市訥河市發(fā)展和改革局所屬事業(yè)單位選調(diào)9人考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解(歷年真題)
- 新教材2025-2026學(xué)年人教版(2024)美術(shù)二年級(jí)上冊(cè)全冊(cè)(教學(xué)設(shè)計(jì))教案
- 2025年數(shù)字化教材在小學(xué)語(yǔ)文教學(xué)中的創(chuàng)新實(shí)踐報(bào)告
- 2025教科版三年級(jí)科學(xué)上冊(cè)教學(xué)計(jì)劃、教學(xué)設(shè)計(jì)(附目錄)
- 木質(zhì)素降解微生物促進(jìn)秸稈飼料化營(yíng)養(yǎng)價(jià)值提升的機(jī)制研究
- 深圳2025中考英語(yǔ)真題及答案
- 全科醫(yī)學(xué)進(jìn)修匯報(bào)
- 六年級(jí)下學(xué)期英語(yǔ)期末考試質(zhì)量分析
- 三基培訓(xùn)及知識(shí)課件
- 監(jiān)控運(yùn)維:方案與實(shí)施
- 河南歷史課件
- 全國(guó)青少年“學(xué)憲法、講憲法”知識(shí)競(jìng)賽題庫(kù)及答案
評(píng)論
0/150
提交評(píng)論