




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
胡雪梅QQ:182048520E-mail:huxuem@163.com
第六章分類數(shù)據(jù)的關(guān)聯(lián)性檢驗(yàn)
數(shù)學(xué)與統(tǒng)計(jì)學(xué)院本章內(nèi)容 列聯(lián)表和檢驗(yàn)數(shù)據(jù)轉(zhuǎn)化:A:A1,A2,…,ArB:B1,B2,…,Bs希望判斷A與B是否獨(dú)立?→獨(dú)立性檢驗(yàn)
假設(shè)檢驗(yàn)問(wèn)題:當(dāng)取大值,或者p-值很小的時(shí)候,拒絕零假設(shè)。構(gòu)造卡方統(tǒng)計(jì)量:例6.1295例6.1>x<-c(98,67,13,18,38,41,8,12,289,262,57,30)>A<-matrix(x,4,3)>A[,1][,2][,3][1,]9838289[2,]6741262[3,]13857[4,]181230>chisq.test(A) Pearson'schi-squaretestdata:AX-square=15.0734,df=6,p-value=0.0197結(jié)論:拒絕H0,即血型與肝病有一定聯(lián)系。練習(xí):一個(gè)市場(chǎng)調(diào)查公司想知道某城市成年人駕駛的汽車式樣與其居住地之間是否存在某種聯(lián)系。抽取了500名成年駕駛者進(jìn)行調(diào)查,其資料如下表所示:500名汽車駕駛者的調(diào)查數(shù)據(jù)居住區(qū)汽車式樣合計(jì)ABC152(45.36)64(52.64)24(42)140260(55.4)59(64.3)52(51.3)171350(61.24)65(71.06)74(56.7)189合計(jì)162188150500解:建立假設(shè)組:Ho:成年人所駕駛的汽車式樣與他們的居住區(qū)之間彼此獨(dú)立;H1:兩種分類彼此不獨(dú)立。設(shè)顯著性水平a為0.05。計(jì)算檢驗(yàn)統(tǒng)計(jì)量:齊性檢驗(yàn)假設(shè)檢驗(yàn)問(wèn)題:齊性檢驗(yàn)
構(gòu)造統(tǒng)計(jì)量:在零假設(shè)下近似有:檢驗(yàn)方法和獨(dú)立性檢驗(yàn)相同。例6.2例如,對(duì)體育類節(jié)目,不同年齡階段的人關(guān)注率是否一樣?解答>y<-c(83,91,41,70,86,38,45,15,10)>B<-matrix(y,3,3)>B[,1][,2][,3][1,]837045[2,]918615[3,]413810>chisq.test(B) Pearson'schi-squaretestwithoutYates'continuitycorrectiondata:BX-square=18.6508,df=4,p-value=0.0009Fisher精確檢驗(yàn)
n..n.1總和n2.n1.n12總和2*2列聯(lián)表在A、B獨(dú)立時(shí):n22n.2
n11n21獨(dú)立性檢驗(yàn)一般要求n11≥5,若不能達(dá)到,則精度受到影響.Fisher精確檢驗(yàn)
例如,假定已知行總數(shù)為5,3,列總數(shù)為5,3,則n11的所有可能取值為2,3,4,5.330322141125003535323450.17860.53570.26780.0179檢驗(yàn)考慮統(tǒng)計(jì)量,拒絕域?yàn)?當(dāng)大樣本時(shí),可以采用近似正態(tài)分布進(jìn)行檢驗(yàn),即:例6.3例6.3>x<-matrix(c(8,14,2,18),2,2)>x[,1][,2][1,]82[2,]1418>fisher.test(x) Fisher'sexacttestdata:xp-value=0.0709alternativehypothesis:two.sided例6.3>chisq.test(x)Warningmessages:Expectedcounts<5.Chi-squareapproximationmaynotbeappropriate.in:chisq.test(x) Pearson'schi-squaretestwithYates'continuitycorrectiondata:xX-square=2.6921,df=1,p-value=0.1008說(shuō)明卡方檢驗(yàn)與Fisher檢驗(yàn)有區(qū)別。Ridit檢驗(yàn)解決問(wèn)題:處理之間進(jìn)行強(qiáng)弱比較。例如,客戶對(duì)某種產(chǎn)品或服務(wù)進(jìn)行綜合評(píng)價(jià):非常滿意,滿意,比較滿意,不滿意,很不滿意。一般對(duì)滿意程度采用的辦法是打分:5,4,3,2,1。1)只能測(cè)量到順序級(jí)別的數(shù)據(jù);2)數(shù)據(jù)量的關(guān)系可能與客觀實(shí)際不符合。Ridit檢驗(yàn)?zāi)畴娦殴菊{(diào)查某款便攜式手機(jī)的售后服務(wù)滿意度,統(tǒng)計(jì)數(shù)據(jù)如下:?jiǎn)栱?xiàng)總數(shù)非常不滿意不滿意一般滿意很滿意1.信號(hào)20090235321132.外形1324734281853.維修質(zhì)量50201310524.功能15428323345165.操作是否方便1643428524010總計(jì)70021913017612946分析各問(wèn)項(xiàng)與滿意度之間的關(guān)系。Ridit檢驗(yàn)行向量A表示不同比較組,列向量B為順序尺度變量,假設(shè),表示對(duì)應(yīng)格子的相應(yīng)頻數(shù)。假設(shè)檢驗(yàn)問(wèn)題:B1B2……Bs總和A1O11O12O1sO1.A2O21O22O2sO2.…………ArOr1Or2OrsOr.總和O.1O.2……O.sO..Ridit檢驗(yàn)pij是第i個(gè)處理第j個(gè)順序類的聯(lián)合概率,p.j是第j個(gè)順序類的邊緣概率。B1B2……Bs總和A1p11p12p1sp1.A2p21p22p2sp2.…………Arpr1pr2prspr.總和p.1p.2……p.sp..Ridit得分定義Ridit得分定義如下(累積概率得分):其中在實(shí)際計(jì)算中用樣本估計(jì)。計(jì)算步驟檢驗(yàn)仿照Kruskal-Wallis統(tǒng)計(jì)量的構(gòu)造:檢驗(yàn)根據(jù)計(jì)算的R構(gòu)造檢驗(yàn)統(tǒng)計(jì)量:當(dāng)大樣本時(shí),T值接近于1,從而檢驗(yàn)統(tǒng)計(jì)量簡(jiǎn)化為:在零假設(shè)情況下,W近似服從分布,當(dāng)W過(guò)大或者過(guò)小的時(shí)候,都考慮拒絕零假設(shè)。檢驗(yàn)求置信區(qū)間:Rj在大樣本的情況下服從正態(tài)分布,則95%的置信區(qū)間為:所以,得到近似公式如果RiditR與RiditRj的置信區(qū)間沒(méi)有重疊,則說(shuō)明兩組之間存在顯著差別。例6.4用頭針治療癱瘓800例的療效分析,不同病因的療效可以不一樣。究竟哪一種療效最佳?統(tǒng)計(jì)數(shù)據(jù)如下:組別總數(shù)基本痊愈顯效有效無(wú)效惡化死亡1.腦血栓形成及后遺癥2.腦出血及后遺癥3.腦栓塞及后遺癥4.顱內(nèi)損失及后遺癥5.急性感染性多發(fā)神經(jīng)炎6.脊髓疾病5101388254106200320441123382412231628330333024138512100000010000總病例數(shù)8002322023115311例6.4等級(jí)(1)(2)(3)(4)(5)(6)1.基本痊愈2.顯效3.有效4.無(wú)效5.惡化6.死亡2322023115311116101155.50232434745798799116333589.5771.5798.5799.50.1450.4160.7370.9640.9980.99933.6484.302229.20751.0920.9980.999合計(jì)800800400列表計(jì)算:累積概率得分例6.4組別總數(shù)基本痊愈顯效有效無(wú)效惡化死亡1.腦血栓形成及后遺癥
Ri5102000.1451230.4161620.737240.96410.99800.999合計(jì)223.6962951.168119.423.1360.9980計(jì)算第一種情況的得分。解答同理可計(jì)算:因?yàn)橹眯艆^(qū)間[0.414,0.466]與[0.48,0.52]不相交,所以拒絕H0。認(rèn)為各種療效有區(qū)別.各組再進(jìn)行比較。R程序輸入數(shù)據(jù)矩陣A=[,1][,2][,3][,4][,5][,6][1,]2001231622410[2,]338831301[3,]202430800[4,]41233500[5,]423100[6,]130200>rA<-rowSums(A)計(jì)算行和>cA<-colSums(A)計(jì)算列和>R<-sum(rA)總樣本數(shù)>R[1]800R程序2)計(jì)算Ridit得分向量>R1<-rep(0,6)>for(jin1:6){R1[j]<-(sum(cA[1:j-1])+0.5*cA[j])/R}>R1[1]0.1450000.4162500.7368750.9643750.9981250.999375R程序3)計(jì)算置信區(qū)間>r<-rep(0,6)>for(iin1:6){r[i]<-sum(A[i,]*R1)/sum(A[i,])}r=0.4386581,0.6590534,0.5208689,0.6428472,0.4587500,0.5537500>d<-rep(0,6)>for(iin1:6){d[i]<-1/sqrt(3*rA[i])}d=0.0255655,0.04914732,0.06
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 科技合作與成果轉(zhuǎn)化責(zé)任書9篇
- 網(wǎng)絡(luò)貨運(yùn)平臺(tái)合作經(jīng)營(yíng)協(xié)議
- 員工績(jī)效評(píng)估標(biāo)準(zhǔn)體系工具
- 2025廣東汕尾市陸河縣高校畢業(yè)生就業(yè)見(jiàn)習(xí)招募15人(第三批)模擬試卷及答案詳解(新)
- 2025年陜西師范大學(xué)校醫(yī)院招聘(2人)考前自測(cè)高頻考點(diǎn)模擬試題完整參考答案詳解
- 員工隱秘保護(hù)制度承諾函6篇
- 2025海南三亞市第二人民醫(yī)院第一次(考核)招聘員額制工作人員(第12號(hào))考前自測(cè)高頻考點(diǎn)模擬試題及1套完整答案詳解
- 2025江蘇蘇州科技大學(xué)招聘46人(第一批)模擬試卷及1套參考答案詳解
- 2025貴州黔東南州天柱縣擬聘用服務(wù)期滿特崗教師李健為事業(yè)單位人員模擬試卷完整參考答案詳解
- 2025貴州習(xí)水縣招聘城鎮(zhèn)公益性崗位19人(4月)模擬試卷及參考答案詳解1套
- 四川省宜賓麗彩集團(tuán)有限公司招聘筆試題庫(kù)2025
- GB/T 45817-2025消費(fèi)品質(zhì)量分級(jí)陶瓷磚
- 25春國(guó)家開放大學(xué)《中央銀行理論與實(shí)務(wù)》形考任務(wù)1-4參考答案
- 姓氏源流與文化尋根(精品·創(chuàng)新·實(shí)用)課件
- 南醫(yī)大之十四經(jīng)脈與常用腧穴課件
- 自動(dòng)化生產(chǎn)線 課件
- 氧化鋯氧量計(jì)測(cè)氧原理課件
- 教科版四年級(jí)(上)科學(xué)1.1聽聽聲音課課練習(xí)題(含答案)
- 原子物理學(xué):第2章 第5節(jié) 索末菲理論
- 金剛經(jīng)講義江味農(nóng)居士遺著
- SOT600 -SY2000交換機(jī)操作指導(dǎo)
評(píng)論
0/150
提交評(píng)論