




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
統(tǒng)計方法選擇與結果解釋劉元元2010.6.12
第一節(jié)
統(tǒng)計方法的正確選擇
一、統(tǒng)計方法選擇的基本思路二、統(tǒng)計分析需注意的若干問題
數據特征樣本含量研究目的對比組數設計類型資料類型
綜合判斷1.研究目的一是通過比較,回答觀測指標的差別是否歸因于處理因素或分組因素,在本教材范圍內所涉及的主要是單變量問題。二是分析變量之間是否存在某種聯系,這主要涉及相關分析和回歸分析,在本教材范圍內所涉及的主要是雙變量問題。
表1.兩種方法檢測12名婦女最大呼氣率(L/min)結果組別有效無效合計甲藥271845乙藥40545合計672390表2.甲、乙兩藥治療小兒上消化道出血的效果2.設計類型
從實驗研究設計來看,常見的設計類型為完全隨機設計(成組設計)配對或配伍設計(隨機區(qū)組設計)
兩樣本(成組)t檢驗單因素(完全隨機設計)方差分析卡方檢驗(獨立樣本)兩樣本Wilcoxon秩和檢驗或多樣本Kruskal-Wallis秩和檢驗對完全隨機設計的數據,應選擇相應的方法:配對t檢驗配伍組(隨機區(qū)組)設計方差分析配對卡方檢驗配對(符號秩和檢驗)或配伍設計的秩和檢驗(Friedman秩和檢驗)等。對于配對或配伍設計的數據,應選擇相應的方法:3.資料類型對于定量變量,選擇它所對應的統(tǒng)計方法?對于定性變量,選擇它所對應的統(tǒng)計方法?
4.數據特征
對于同一設計類型和同一資料類型,仍然有許多方法可以選擇。表3.九個測定點用甲、乙兩種方法的測定結果(μg/m3)t檢驗和方差分析屬參數檢驗方法,對數據要求較高,通常要求數據服從正態(tài)分布和方差齊性。如果服從該條件或經變量變換后服從條件,則采用參數檢驗方法,否則采用秩和檢驗這類非參數檢驗方法。能否不考慮分布和方差齊性問題,直接采用非參數檢驗?5.對比組數單組問題(樣本與與已知總體參數比較)兩組問題多組(3組或以上)比較注意,多組比較在差別有統(tǒng)計學意義時,需再進行兩兩比較。6.樣本含量在樣本較小時:如果是一個樣本率與總體率的比較,可采用直接計算概率的方法如基于二項分布的確切概率法。如果是四格表資料則采用Fisher確切概率法或校正卡方檢驗。對于均數比較問題,一般情況下采用t檢驗。在大樣本時:可考慮Z檢驗作近似。在實際工作中,遇到的實際問題可能并非如此簡單,須結合專業(yè)問題和所要分析的具體內容加以綜合考慮和仔細判斷,有時需對各種統(tǒng)計方法加以綜合運用。
此外:當分析目的是分析變量之間是否存在某種聯系時,這就涉及到雙變量的分析方法,即相關關系或回歸關系的分析。需注意相關分析和回歸分析的區(qū)別與聯系關聯性分析:對于定量變量,需根據兩個變量是否滿足雙變量正態(tài)分布,相應地采用Pearson積矩相關分析或Spearman秩相關分析。對于等級變量則直接采用Spearman秩相關分析。對分類變量,常計算列聯系數進行分析對于R×C表資料,需注意區(qū)分是單向有序或者是雙向有序對于一個二分類變量和一個等級變量之間的線性關聯通常采用線性趨勢卡方檢驗表4.某市不同年級中學生吸煙率
年級調查人數(n)吸煙人數(t)吸煙率(%)初一1441711.81初二1481912.84初三1352518.52高一1574126.11高二1685532.74高三1397251.80合計891229—生存分析:是一類較為特殊的針對具有截尾數據的生存時間數據所進行的分析針對分組和未分組資料,方法有所不同多變量的數據分析:多重線性回歸是對反應變量為定量變量進行的多變量分析Logistic回歸是對反應變量為分類變量所進行的多變量分析Cox比例風險回歸是對反應變量為含有截尾數據的生存時間所進行的分析一、統(tǒng)計方法選擇的基本思路二、統(tǒng)計分析需注意的若干問題1.數據分析通常的步驟
數據探測統(tǒng)計描述統(tǒng)計推斷數據探測數據分布特征、方差齊性、散點圖繪制、離群值的發(fā)現,以及了解數據是否符合特定統(tǒng)計方法的應用條件等,必要時可進行變量變換或轉換以滿足分析的需要。數據探測將增加對數據的基本了解,為進一步的分析奠定基礎。統(tǒng)計描述統(tǒng)計描述內容?注意首先要區(qū)分變量類型統(tǒng)計推斷在數據探測和統(tǒng)計描述的基礎上選擇恰當的統(tǒng)計推斷方法分析資料。區(qū)間估計:總體均數區(qū)間估計:可采用t分布或正態(tài)分布原理進行估計總體率區(qū)間估計:可采用二項分布、Poisson分布或正態(tài)分布原理進行估計2.混雜因素的控制非研究因素的“可比性”問題可比性好,各組觀測指標之間的差異只能歸因于研究因素而不是其它原因如果各組在研究因素之外的某種或某些因素有所不同,那么這個或這些其它因素的效應就可能同研究因素的效應混淆在一起在這種情況下,通常的統(tǒng)計分析結論在進行因果推斷時常常是不可靠的對于非研究因素不具可比性的資料,應采用統(tǒng)計調整技術消除那些因素的影響對于具有多個變量的復雜情況,則需采用多變量分析技術加以調整分析階段控制混雜因素可采用:
1)分層分析
2)標準化法
3)協(xié)方差分析
4)多重回歸1)分層分析Example:研究吸煙與健康的關系吸煙與非吸煙者死亡率的比較吸煙者與不吸煙者死亡率的直接比較可能存在問題因為:吸煙者多為男性,而男性比女性更易患心臟病而發(fā)生死亡,吸煙者與未吸煙者之間死亡率的差異也許是因為性別的差異為了排除這種可能性,可以性別因素分層,再比較吸煙與非吸煙者的死亡率:男性人群中,吸煙與不吸煙者進行比較女性人群中,吸煙與不吸煙者進行比較年齡可能又是另外一個混雜因素,這就需要對年齡進行分層分析:男≥40歲<40歲女≥40歲<40歲
以上是通常的分層分析思路,但這并不能保證這樣分析的結論一定是正確的尤其當:調查設計存在嚴重問題,樣本對總體代表性很差,未能反映被調查總體的真實情況時另需注意:當一個事件的影響因素較多時,由于不斷分層的結果致使某些層中樣本含量太少;采用這種簡單的分層分析可能割裂多個因素之間的內在聯系,難以真實揭示多個因素對觀測結果的影響,從而導致錯誤的結論。表5.兩種療法治療某病的病死率病型新療法一般療法治療人數死亡人數病死率(%)治療人數死亡人數病死率(%)普通型75
1520.025520.0重型合計35
1440.0652640.0110
2926.4903134.42)標準化法新療法組的標準化病死率:一般療法組的標準化病死率:標準化法解決了由于患者病型構成不同而導致的合計病死率與分病型比較相矛盾的問題表6.兩班人數及百米跑優(yōu)秀率統(tǒng)計3.正確理解可比性問題如果我們的目的是想了解“班級因素”,即分組因素對優(yōu)秀率的影響或作用,同時知道還存在其它影響優(yōu)秀率的因素在各組分布不一致(即存在混雜因素),此時談論“可比性”才是有意義的正確做法:消除混雜因素的影響,揭示分組因素對研究指標的影響或作用表7.直接法計算標準化率但如果研究目的并非探討分組因素對研究指標的影響或作用,談論可比性沒有意義,也沒必要去調整混雜因素的影響
單純描述誰高誰低無需進行調整,只是在進一步探究導致高低不同的歸因(所謂因素分析)時才對混雜因素進行控制或調整4.數據的分組問題同質性問題分組:就是將專業(yè)上認為性質相同的個體歸在一起,將性質不同的個體區(qū)別開來,即試圖在專業(yè)上反映出組內的同一性和組間的差異性實戰(zhàn)練習1.欲了解某地城鄉(xiāng)嬰兒營養(yǎng)狀況有無差別,測量了其血紅蛋白含量,見表1該資料屬何種類型?該資料屬何種設計?不同月齡嬰兒的血紅蛋白濃度有無差異?Anyelse?月齡調查人數血紅蛋白濃度(g/dl)農村城市農村(mean±std)城市(mean±std)512252111.3±9.1124.8±10.178760106.3±8.7121.6±9.9表1.某地嬰兒血紅蛋白濃度該資料類型?屬何種設計類型?可用何種統(tǒng)計方法分析上述資料?
新法11.215.015.013.512.715.411.012.113.012.2舊法12.113.414.513.013.214.911.711.413.812.02.某檢驗員用兩種方法測定了10名正常人的血紅蛋白含量(g/dl),結果如下:3.選甲型流感病毒感染者24人,隨機分成2組,每組12人。用甲型流感病毒活疫苗進行免疫,一組用鼻腔噴霧法(X1),另一組用氣霧法(X2),免疫后一月采血,分別測定血凝抑制抗體滴度,結果如下。問兩法免疫的效果是否不同?X1
:504030356070302025703525X2
:4020302510152530401015304.某醫(yī)生用潑尼松、轉移因子和胸腺肽治療系統(tǒng)性紅斑狼瘡(SLE)患者14人。治療前后血清Sil-2R(U/ml)數據見下表。他用成組設計兩樣本t檢驗,得t
=0.3737,P=0.7116。因此他得出治療前后血清Sil-2R的差異沒有統(tǒng)計學意義的結論,請問該結論是否正確?
編號治療前治療后11410.371353.572893.54876.8831569.451534.424936.51879.985529.94468.666477.23427.237999.40971.56………141097.991022.31表2.治療前后血清Sil-2R(U/ml)數據4.某醫(yī)生用潑尼松、轉移因子和胸腺肽治療系統(tǒng)性紅斑狼瘡(SLE)患者14人。治療前后血清Sil-2R(U/ml)數據見下表。他用成組設計兩樣本t檢驗,得t
=0.3737,P=0.7116。因此他得出治療前后血清Sil-2R的差異沒有統(tǒng)計學意義的結論,請問該結論是否正確?
有人提議用配對t檢驗,如果治療前后的差異有統(tǒng)計學意義就可以說明治療有效,你同意否?5.某地抽樣調查了部分健康成人的紅細胞數,其中男性360人,均數為4.660
1012/L,標準差為0.575
1012/L;女性255人,均數為4.178
1012/L,標準差為0.291
1012/L,試問該地男、女平均紅細胞數有無差別?6.某社區(qū)隨機抽取了30名糖尿病患者、IGT異常和正常人進行載脂蛋白含量(mg/dL)測定,結果見下表,問三種人的載脂蛋白有無差別?
7.在抗癌藥篩選試驗中,5個窩別,各4只,共20只小白鼠,按不同窩別分為5組。分別觀察三種藥物、一種對照物,對小白鼠肉瘤(S180)的抑瘤效果窩別藥物組別對照組ABCI0.800.360.170.28II0.740.500.420.36III0.310.200.380.25IV0.480.180.440.22V0.760.260.280.13表3.三種藥物抑瘤效果的比較(瘤重,g)藥物組別對照組ABC0.800.360.170.280.740.500.420.360.310.200.380.250.480.180.440.220.760.260.280.13new表3.三種藥物抑瘤效果的比較(瘤重,g)8.用15只小白鼠,隨機分為3組,比較小白鼠接種三種不同菌型傷寒桿菌9D、11C、DSC1后存活天數,實驗數據見表6,問接種不同菌型傷寒桿菌的小白鼠存活天數間有無差別?
9D
11C
DSC114
73
5
94
610
5
811510
13
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度電線電纜銷售與節(jié)能環(huán)保產業(yè)合作合同
- 二零二五年虛擬現實內容制作合同
- 二零二五年能源管理服務簡易借款合同
- 2025版災害防治工程建設項目施工合同規(guī)范文本
- 二零二五年度二手房買賣合同及附屬設施轉讓協(xié)議
- 2025版城市排水管網修復與改造工程合同
- 2025版冷鏈運輸專項合同規(guī)范文本解讀
- 2025版放羊產業(yè)標準化與品牌化合作合同
- 二零二五年珠寶玉石鑒定與檢測服務合同
- 二零二五版電力設施安裝與檢修服務合同規(guī)范
- 校園基孔肯雅熱防控措施課件
- (2025年標準)離職手協(xié)議書
- 2025年團場人員考試題庫
- 班組質量管理
- 2025年四川省建筑施工企業(yè)安管人員考試(企業(yè)主要負責人·A類)歷年參考題庫含答案詳解(5卷)
- 實戰(zhàn)能力評估模型-洞察及研究
- 生豬屠宰獸醫(yī)衛(wèi)生檢驗人員理論考試題庫及答案
- 心臟起搏器植入指南
- 干部任免審批表(全國干部人事檔案專項審核專用)
- 2023年生態(tài)環(huán)境綜合行政執(zhí)法考試參考題庫(400題)
- 鄉(xiāng)村全科執(zhí)業(yè)助理醫(yī)師考試試題
評論
0/150
提交評論