(完整版)醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)要點(diǎn)_第1頁(yè)
(完整版)醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)要點(diǎn)_第2頁(yè)
(完整版)醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)要點(diǎn)_第3頁(yè)
(完整版)醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)要點(diǎn)_第4頁(yè)
(完整版)醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)要點(diǎn)_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章緒論1、數(shù)據(jù)/資料的分類:、計(jì)量資料,又稱定量資料或者數(shù)值變量;為觀測(cè)每個(gè)觀察單位某項(xiàng)治療的大小而獲得的資料。、計(jì)數(shù)資料,又稱定性資料或者無(wú)序分類變量;為將觀察單位按照某種屬性或者類別分組計(jì)數(shù),分組匯總各組觀察單位數(shù)后而得到的資料。、等級(jí)資料,又稱半定量資料或者有序分類變量。為將觀察單位按某種屬性的不同程度分成等級(jí)后分組計(jì)數(shù),分類匯總各組觀察單位數(shù)后而得到的資料。2、統(tǒng)計(jì)學(xué)常用基本概念:、統(tǒng)計(jì)學(xué)(statistics)是關(guān)于數(shù)據(jù)的科學(xué)與藝術(shù),包括設(shè)計(jì)、搜集、整理、分析和表達(dá)等步驟,從數(shù)據(jù)中提煉新的有科學(xué)價(jià)值的信息。、總體(population)指的是根據(jù)研究目的而確定的同質(zhì)觀察單位的全體

2、。、醫(yī)學(xué)統(tǒng)計(jì)學(xué)(medicalstatistics)=用統(tǒng)計(jì)學(xué)的原理和方法處理醫(yī)學(xué)資料中的同質(zhì)性和變異性的科學(xué)和藝術(shù),通過(guò)一定數(shù)量的觀察、對(duì)比、分析,揭示那些困惑費(fèi)解的醫(yī)學(xué)問(wèn)題背后的規(guī)律性。、樣本(sample):指的是從總體中隨機(jī)抽取的部分觀察單位。、變錄(variable):對(duì)觀察單位某項(xiàng)特征進(jìn)行測(cè)量或者觀察,這種特征稱為變量。、頻率(frequency):指的是樣本的實(shí)際發(fā)生率。、概率(probability):指的是隨機(jī)事件發(fā)生的可能性大小。用大寫的P表示。3、統(tǒng)計(jì)工作的基本步驟:、統(tǒng)計(jì)設(shè)計(jì):包括對(duì)資料的收集、整理和分析全過(guò)程的設(shè)想與安排;、收集資料:采取措施取得準(zhǔn)確可靠的原始數(shù)據(jù);、

3、整理資料:將原始數(shù)據(jù)凈化、系統(tǒng)化和條理化;、分析資料:包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷兩個(gè)方面。第二章計(jì)量資料的統(tǒng)計(jì)描述頻數(shù)表的編制方法,頻數(shù)分布的類型及頻數(shù)表的用途、求極差(range):也稱全距,即最大值和最小值之差,記作R;、確定組段數(shù)和組距,組段數(shù)通常取10-15組;、根據(jù)組距寫出組段,每個(gè)組段的下限為L(zhǎng),上限為U,變量X值得歸組統(tǒng)一定為L(zhǎng)WX60)時(shí):按u分布雙側(cè)和單側(cè)公式見3、8、3-9、3-10B、兩總體均數(shù)之差的可信區(qū)間:豪前提:兩總體方差相等,但均數(shù)不等計(jì)算公式見于3-12、3-13、3-148、t分布圖的特征:、單峰分布,以0為中心,左右對(duì)稱;量;、t分布的曲線形態(tài)取決于自由度v的大

4、小,自由度越小,則t值越分散,曲線的峰部越矮而尾部翹得越高;、當(dāng)自由度逼近無(wú)窮的時(shí)候,樣本標(biāo)準(zhǔn)誤接近總體標(biāo)準(zhǔn)誤,t分布逼近標(biāo)準(zhǔn)正態(tài)分布。(標(biāo)準(zhǔn)正態(tài)分布是t分布的特例)9、t檢驗(yàn)的適用條件t檢驗(yàn)(ttest/Studentt-test)當(dāng)o未知且樣本含量較小時(shí)(如n50時(shí)可用正態(tài)分布近似法秩檢驗(yàn)兩獨(dú)立樣本比較適用于推斷計(jì)量資料或等級(jí)資料的兩個(gè)獨(dú)立樣本所來(lái)自的兩個(gè)總體分布是否有差別方差不齊正態(tài)分布秩和(正秩和或負(fù)秩和)T值n110或n2-n110可用正態(tài)分布近似法作u檢驗(yàn)完全隨機(jī)多樣本比較用于推斷計(jì)量資料或者等級(jí)資料的多個(gè)獨(dú)立樣本所來(lái)自的多個(gè)總體分布是否有差別無(wú)方差齊性要求無(wú)正態(tài)分布要求H檢驗(yàn)H值

5、g=3且最小樣本的例數(shù)大于5或g3,H近似服從g-1的正態(tài)分布,可用卡方分布法多變量資料的處理回歸與相關(guān)雙變量直線回歸用于對(duì)兩變量總體間線性關(guān)系的估計(jì)線性、獨(dú)立、方差齊性、誤差服從均數(shù)為0的正態(tài)分布回歸方程(回歸系數(shù))雙變量直線相關(guān)用于判斷兩個(gè)數(shù)值變量之間有無(wú)線性關(guān)系,雙變量正態(tài)分布資料正態(tài)分布相關(guān)系數(shù)r相關(guān)系數(shù)求出后應(yīng)做假設(shè)檢驗(yàn)多元線性回歸用于分析一個(gè)應(yīng)變量與多個(gè)自變量之間的線性關(guān)系正態(tài)分布多元回歸方程回歸方程求出后應(yīng)做整體假設(shè)檢驗(yàn)以及各自變量的假設(shè)檢驗(yàn)第四章多樣本均數(shù)比較的方差分析1、概念:離均差平方和(sumofsquaresofdeviationfrommeanSS)指的是各個(gè)觀測(cè)值與

6、總均數(shù)差值的平方。均方差,簡(jiǎn)稱均方(meansquare,MS)指的是離均差平方和與自由度之間的比值。2、方差分析的基本思想:設(shè)處理因素有g(shù)(g三2)個(gè)不同的水平,實(shí)驗(yàn)對(duì)象隨機(jī)分為g組,分別接受不同水平的干預(yù)。方差分析的目的就是在H0:二口2二二成立的條件下,通過(guò)分析各處理均數(shù)之間的差別大小,推斷g各總體均數(shù)間有無(wú)差別。3、方差分析的應(yīng)用條件為:各個(gè)樣本是相互獨(dú)立的隨機(jī)樣本,均來(lái)自于正態(tài)分布總體;相互比較的各個(gè)樣本的總體方差相等,即具有方差齊性。4、方差分析的變異分析:總變異的大小SS總:各個(gè)觀測(cè)值與總均數(shù)差值的平方和;總組間變異的大小SS組間:各組均數(shù)與總均數(shù)的離均差平方和;組內(nèi)變異的大小S

7、S組內(nèi):組內(nèi)個(gè)觀測(cè)值與其所在組的均數(shù)的差值的平方和。組內(nèi)并有SS總=SS組間+SS組內(nèi)由于組間與組內(nèi)的離均差平方和的自由度不同,因此單純的比較并無(wú)實(shí)際意義。MS組間=SS組間組間;MS組內(nèi)=SS組內(nèi)/v組內(nèi)5、完全隨機(jī)設(shè)計(jì)資料的方差分析:變異來(lái)源自由度MSF總變異N-1組間g-1MS、組間MS./MS_組間組內(nèi)組內(nèi)N-g組內(nèi)完全隨機(jī)設(shè)計(jì)資料:正態(tài)分布且方差齊:?jiǎn)我蛩胤讲罘治龀山Mt檢驗(yàn)(意義相同t2二F)總變異N-1處理組g-1MSMS“處H田;誤差行區(qū)組g-1MSqMS行/MS誤差列區(qū)組g-1MS和萬(wàn)IIMS列/MS誤差、口誤差(g-1)(g-2)MS誤差8、兩階段交叉設(shè)計(jì)資料的方差分析該設(shè)計(jì)

8、不僅平衡了處理順序的影響,而且能把處理方法間的差別、時(shí)間先后之間的差別和實(shí)驗(yàn)對(duì)象之間的差別分開來(lái)分析。非正態(tài)分布或/和方差不齊:變量轉(zhuǎn)換T單因素方差分析秩和檢驗(yàn)6、隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析:變異來(lái)源自由度MSF總變異N-1處理間g-1MS處理MS處理/MS誤差區(qū)組間n-1MS區(qū)組MS區(qū)組/MS誤差、口誤差(n-1)(g-1)MS誤差隨機(jī)區(qū)組設(shè)計(jì)資料:正態(tài)分布且方差齊:雙向分類的方差分析配對(duì)t檢驗(yàn)(意義相同t2二F)非正態(tài)分布或/和方差不齊:變量轉(zhuǎn)換T雙向分類的方差分析FriedmanM檢驗(yàn)初衷:考慮環(huán)境因素對(duì)實(shí)驗(yàn)結(jié)果的影響。7、拉丁方設(shè)計(jì)資料的方差分析:可多安排一個(gè)已知的對(duì)實(shí)驗(yàn)結(jié)果有影響的非

9、處理因素,增加了均衡性,減少了誤差提高了效率。完全隨機(jī)設(shè)計(jì)只涉及一個(gè)處理因素;隨機(jī)區(qū)組設(shè)計(jì)涉及一個(gè)處理因素、一個(gè)區(qū)組因素;如果實(shí)驗(yàn)研究涉及一個(gè)處理因素和兩個(gè)控制因素,每個(gè)因素的類別數(shù)或水平數(shù)相等,此時(shí)可采用拉丁方設(shè)計(jì)。變異來(lái)源自由度MSF9、多樣本均數(shù)間的多重比較方法丄SD-t檢驗(yàn)、Dunnett-t檢驗(yàn)、SNK-q檢驗(yàn)三種10、多樣本方差比較:Bartlett檢驗(yàn)、Levene檢驗(yàn)第五章計(jì)數(shù)資料的統(tǒng)計(jì)描述1、基本概念:、相對(duì)數(shù)(Relativenumber):是兩個(gè)有關(guān)聯(lián)的數(shù)據(jù)之比,用以說(shuō)明事物的相對(duì)關(guān)系,便于對(duì)比分析。常用的相對(duì)數(shù)指標(biāo)很多,按聯(lián)系的性質(zhì)和說(shuō)明的問(wèn)題不同,主要分為:率、構(gòu)成、

10、相對(duì)比三類。、強(qiáng)度相對(duì)數(shù)-頻率(frequency):是最常見的一種相對(duì)數(shù),頻率在實(shí)踐中又稱為比率(proportion)。它表示事物內(nèi)部某個(gè)組成部分所占的相對(duì)多少。、結(jié)構(gòu)相對(duì)數(shù)一構(gòu)成比(constituentratio):說(shuō)明某事物內(nèi)部各組成部分所占的比重或分布,又稱構(gòu)成比。構(gòu)成比可相加,和等于100%。、優(yōu)勢(shì)相對(duì)數(shù)-比(ratio):是指兩個(gè)有關(guān)聯(lián)的指標(biāo)A和B之比,簡(jiǎn)稱比。A和B可以是性質(zhì)相同,也可以是性質(zhì)不相同。通常以倍數(shù)或百分?jǐn)?shù)(%)表示。、率的標(biāo)準(zhǔn)化法:指的是消除內(nèi)部構(gòu)成差別,使總體率能夠直接進(jìn)行比較的方法。采用統(tǒng)一標(biāo)準(zhǔn)調(diào)整后的率為標(biāo)準(zhǔn)化率,簡(jiǎn)稱為標(biāo)化率(standardizedra

11、te)。標(biāo)準(zhǔn)化的基本思想:采用統(tǒng)一的“標(biāo)準(zhǔn)人口構(gòu)成”,以消除人口構(gòu)成不同對(duì)各組總率的影響,使算得的標(biāo)準(zhǔn)化率具有可比性。、動(dòng)態(tài)數(shù)列(dynamicseries):是按時(shí)間順序排列的統(tǒng)計(jì)指標(biāo)(可以為絕對(duì)數(shù),相對(duì)數(shù)或平均數(shù)),用以觀察和比較該事物在時(shí)間上的變化和發(fā)展趨勢(shì)。分析動(dòng)態(tài)數(shù)列常用的指標(biāo)有:絕對(duì)增長(zhǎng)量、發(fā)展速度與增長(zhǎng)速度、平均發(fā)展速度與平均增長(zhǎng)速度。、發(fā)展速度:表示報(bào)告期指標(biāo)的水平相當(dāng)于基線期(或前一期)指標(biāo)的百分之多少或若干倍。、增長(zhǎng)速度:表示的是凈增加速度,增長(zhǎng)速度二發(fā)展速度-1(100%)o2、率的標(biāo)準(zhǔn)化的注意事項(xiàng):標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化率,已經(jīng)不再反映當(dāng)時(shí)當(dāng)?shù)氐膶?shí)際水平,它只是表示相互比較的

12、資料間的相對(duì)水平。兩樣本標(biāo)準(zhǔn)化率是樣本值,存在抽樣誤差。當(dāng)樣本含量較小時(shí),比較兩樣本的標(biāo)準(zhǔn)化率,需要作假設(shè)檢驗(yàn)。(但如果比較的兩者是總體的參數(shù)則可進(jìn)行直接比較,無(wú)需進(jìn)行t、F檢驗(yàn))第六章幾種離散型變量的分布及其應(yīng)用連續(xù)型分布舉例:u分布、t分布和F分布;常用離散型分布:二項(xiàng)分布、Poisson分布、負(fù)二項(xiàng)分布。Is基本概念、二項(xiàng)分布(binomialdistribution):是指在只會(huì)產(chǎn)生兩種可能結(jié)果之一的n次獨(dú)立重復(fù)試驗(yàn)中,當(dāng)每次實(shí)驗(yàn)的陽(yáng)性”的概率TI保持不變時(shí),出現(xiàn)陽(yáng)性”次數(shù)X=0,l,2n的一種概率分布。、Poisson分布(Poissondistribution):是二項(xiàng)分布的一種極

13、端形式,指的是每次實(shí)驗(yàn)的“陽(yáng)性”概率比較低的時(shí)候出現(xiàn)陽(yáng)性次數(shù)的相應(yīng)概率滿足以入為參數(shù)的XP(入)。2、二項(xiàng)分布的適用條件:、每次試驗(yàn)只會(huì)發(fā)生兩種隊(duì)里的額可能結(jié)果之一,即分別發(fā)生兩種結(jié)果的概率之和很等于1;、每次試驗(yàn)產(chǎn)生某種結(jié)果的概率固定不變;、重復(fù)試驗(yàn)是相互獨(dú)立的,不相互影響。3、二項(xiàng)分布的性質(zhì)、樣本率的標(biāo)準(zhǔn)差也稱為率的標(biāo)準(zhǔn)誤,可以用來(lái)描述樣本率的抽樣誤差,率的標(biāo)準(zhǔn)誤越小,則率的抽樣誤差就越小。、當(dāng)71=0.5W,二項(xiàng)分布圖形是對(duì)稱的,當(dāng)nO.5時(shí),圖形是偏態(tài)的,隨著n增大,圖形趨于對(duì)稱。當(dāng)n-無(wú)窮時(shí),只要tt不太旅近0或1,二項(xiàng)分布則近似正態(tài)分布。、利用二項(xiàng)分布的性質(zhì),可進(jìn)行總體率的區(qū)間估計(jì)

14、和差異推斷。(當(dāng)nW50時(shí)可查表得到可信區(qū)間,50是可采用近似正態(tài)分布法)4、Poisson分布的適用條件:普通性:才充分小的觀測(cè)單位上X的取值最多為1;獨(dú)立增量性:重復(fù)實(shí)驗(yàn)室相互獨(dú)立的,不相互影響;平穩(wěn)性:每次試驗(yàn)陽(yáng)性時(shí)間發(fā)生的概率都應(yīng)相同。5、Poisson分布的性質(zhì):、總體均數(shù)入與總體方差j2相等時(shí)Poisson分布的重要特征;、當(dāng)n很大,而兀很小時(shí),且rm二入為常數(shù)時(shí),二項(xiàng)分布近似Poisson分布;、當(dāng)入增大時(shí),Poisson分布逐漸近似正態(tài)分布。一般而言,入三20時(shí),Poisson分布資料可作為正態(tài)分布處理。、Poisson分布具備可加性。6、Poisson分布的圖形特點(diǎn):當(dāng)入越小

15、,分布就越偏態(tài);當(dāng)入越大時(shí),Poisson分布則越漸近正態(tài)分布。當(dāng)入時(shí),隨X取值的變大,P(X)值反而會(huì)變小;當(dāng)入1時(shí),隨X取值的變大,P(X)值先增大后變小。第七章卡方檢驗(yàn)護(hù)IsX2分布曲線的特點(diǎn):X2分布曲線的形狀依賴于自由度的大小當(dāng)自由度W2時(shí),曲線呈L形;隨著自由度的增加,曲線逐漸趨于對(duì)稱;當(dāng)自由度T無(wú)窮時(shí),X?分布趨近正態(tài)分布。2、X?分布的基本性質(zhì):可加性;3、X?檢驗(yàn)的原理:通過(guò)實(shí)際頻數(shù)和理論頻數(shù)滿足f(X2),來(lái)推斷實(shí)際頻數(shù)與理論頻數(shù)的差異大小及有無(wú)統(tǒng)計(jì)學(xué)意義。4、幾種常見的資料類型:、普通四格表:自由度二(行數(shù)-1)(列數(shù)-1)X?可使用四格表專用公式;x:n三40且所有的T

16、三5使用基本公式;Pa時(shí),改用Fisher確切概率法;n三40但有1WTW5四格表校正公式或者Fisher確切概率法n40或T1Fisher確切概率法配對(duì)四格表資料:b+c50時(shí)可以采用近似正態(tài)法作u檢驗(yàn))H0:樣本總體中位數(shù)二人群總體中位數(shù);H1:樣本總體中位數(shù)工人群總體中位數(shù)。兩獨(dú)立樣本的比較:(nl10或n2-nl10時(shí),令nl+n2=N,作近似正態(tài)分布檢驗(yàn))H0:兩樣本總體分布位置相同;H1:兩樣本總體分布位置不同。完全隨機(jī)多個(gè)樣本:H0:多個(gè)樣本總體分布位置相同;H1:多個(gè)樣本總體分布位置不全相同。注意:當(dāng)完全隨機(jī)的多個(gè)樣本為兩個(gè)樣本時(shí),使用完全隨機(jī)多個(gè)樣本的檢驗(yàn)方法求得的統(tǒng)計(jì)值H(

17、或HQ與使用兩獨(dú)立樣本的u檢驗(yàn)求得的u值等價(jià)。H=u2o第九章=雙變回歸與相關(guān)Is直線回歸(linearregression):因變量丫隨著自變量X的變化而變化呈直線趨勢(shì),但并非所有的對(duì)應(yīng)點(diǎn)恰好全都在一條直線上,稱為直線回歸或者簡(jiǎn)單回歸。注:a為常數(shù)項(xiàng),是回歸直線在丫軸上的截距;b為回歸系數(shù)(coefficientofregression),為直線的斜率;其統(tǒng)計(jì)意義是當(dāng)X變化一個(gè)單位時(shí)丫的平均改變的估計(jì)值。直線回歸方程的求法基本原則:最小二乘(leastsumofsquares)將實(shí)測(cè)值與假定回歸線上的估計(jì)值的縱向距離稱為殘差(residual)或剩余值。為了使各點(diǎn)殘差盡可能的小,考慮到所有點(diǎn)

18、之殘差有正有負(fù),所以通常取各點(diǎn)殘差平方和最小的直線即為所求,如此得到的回歸系數(shù)最理想。統(tǒng)計(jì)推斷的檢驗(yàn):方差分析F檢驗(yàn)或者t檢驗(yàn)兩者等價(jià):t二F2b離0赤戊沅.Y寺X的影響赤戊大.SS回京非赤戊大.回歸數(shù)果赤戊女孑;SS殘?jiān)叫?,估?jì)誤弟越小,回歸作用越明顯。2、直線相關(guān)(linearcorrelation):兩個(gè)數(shù)值變量進(jìn)行比較時(shí),一變量在增加或者減少時(shí),另一個(gè)變量也表現(xiàn)為增加或者減少,這兩個(gè)變量之間的關(guān)系即為直線相關(guān)。相關(guān)系數(shù)(correlationcoefficient)又稱為pearson積差相關(guān)系數(shù),以符號(hào)表示樣本相關(guān)系數(shù),符號(hào)p表示其總體相關(guān)系數(shù)。用來(lái)說(shuō)明具有直線關(guān)系的兩變量間相關(guān)的密

19、切程度與相關(guān)方向。相關(guān)系數(shù)的統(tǒng)計(jì)推斷:t檢驗(yàn)決定系數(shù)(coefficientofdetermination):為回歸平方和與總平方和之比。其數(shù)值大小反映了回歸貢獻(xiàn)的相對(duì)程度,也就是在丫的總變異中回歸關(guān)系所能解釋的百分比。3、殘差圖考察數(shù)據(jù)是否符合模型假設(shè)的基本要求:、應(yīng)變量與自變量關(guān)系為線性;、誤差服從均數(shù)為0的正態(tài)分布;、方差相等;、各觀測(cè)對(duì)象獨(dú)立。4、直線回歸與直線相關(guān)的區(qū)別和共同點(diǎn)區(qū)別:相關(guān)系數(shù)無(wú)單位,回歸系數(shù)有單位;相關(guān)表示相互關(guān)系,沒(méi)有依存關(guān)系,回歸有依存關(guān)系;兩者對(duì)資料的要求不同當(dāng)X和丫都是隨機(jī)的,可以進(jìn)行相關(guān)和回歸分析;當(dāng)丫是隨機(jī)變量,X是控制變量時(shí),理論上只能做回歸分析。聯(lián)系:

20、均表示線性關(guān)系;符號(hào)相同,共變方向一致;假設(shè)檢驗(yàn)結(jié)果相同;(tr=tb)可以互相換算(數(shù)值的相同不代表意義的相同)第十二章童復(fù)測(cè)量設(shè)計(jì)資料的方差分析Is重復(fù)測(cè)量設(shè)計(jì)資料的數(shù)據(jù)特征:、未設(shè)立平行對(duì)照的前后測(cè)量設(shè)計(jì):(重復(fù)測(cè)量資料最常見的情況是前后測(cè)量設(shè)計(jì))前后測(cè)量設(shè)計(jì)與配對(duì)設(shè)計(jì)t檢驗(yàn)的區(qū)別:a、配對(duì)設(shè)計(jì)中同一對(duì)子的兩個(gè)實(shí)驗(yàn)單位可以隨機(jī)分配處理,兩個(gè)實(shí)驗(yàn)單位同期觀察實(shí)驗(yàn)結(jié)果,可以比較處理組間差別;前后測(cè)量設(shè)計(jì)不能同期觀察實(shí)驗(yàn)結(jié)果,雖然可以在前后測(cè)量之間安排處理,但本質(zhì)上比較的是前后差別,推論處理是否有效是有條件的,即假定測(cè)量時(shí)間對(duì)觀察結(jié)果沒(méi)有影響。b、配對(duì)t檢驗(yàn)要求同一對(duì)子的兩個(gè)實(shí)驗(yàn)單位的觀察結(jié)果

21、分別是差值相互獨(dú)立,差值服從正態(tài)分布。而前后測(cè)量設(shè)計(jì)前后兩次觀察結(jié)果通常與差值不獨(dú)立,大多數(shù)情況第一次觀察結(jié)果與差值存在負(fù)相關(guān)的關(guān)系。c、配對(duì)設(shè)計(jì)用平均差值推論處理的作用,前后測(cè)量設(shè)計(jì)出了分析平均差值外,還可進(jìn)行相關(guān)分析。、設(shè)立平行對(duì)照的前后測(cè)量設(shè)計(jì):雖然分為處理組和對(duì)照組,但是不能進(jìn)行差值均數(shù)t檢驗(yàn),因?yàn)橥ǔ山M差值的方差不會(huì)相等。、重復(fù)測(cè)量設(shè)計(jì):重復(fù)測(cè)量數(shù)據(jù)與隨機(jī)區(qū)組設(shè)計(jì)數(shù)據(jù)相似,兩者的差別是:a、重復(fù)測(cè)量設(shè)計(jì)中處理是在區(qū)組間隨機(jī)分配,區(qū)組內(nèi)的各時(shí)間點(diǎn)是固定的,不能隨機(jī)分配;隨機(jī)區(qū)組設(shè)計(jì)則要求每個(gè)區(qū)組內(nèi)實(shí)驗(yàn)單位彼此獨(dú)立,處理只能在區(qū)組內(nèi)隨機(jī)分配,每個(gè)實(shí)驗(yàn)單位接受的處理是不相同的。b、重復(fù)測(cè)

22、量設(shè)計(jì)區(qū)組內(nèi)實(shí)驗(yàn)單位彼此不獨(dú)立,而隨機(jī)區(qū)組內(nèi)實(shí)驗(yàn)單位彼此獨(dú)立,如果按照隨機(jī)區(qū)組進(jìn)行t檢驗(yàn)則要求進(jìn)行統(tǒng)計(jì)值的校正。第十五章多元線性回歸資料的分析適用范圍:分析一應(yīng)變量與多個(gè)自變量之間的線性關(guān)系;1、多元線性回歸模型的一般形式:Y=pO+plXl+p2X2+pmXm+ea、偏回歸系數(shù)Bj的意義:表示在其他自變量保持不變的時(shí)候Xj增加或減少一單位時(shí)丫的平均變化量。b、偏回歸分布的應(yīng)用條件:、丫與各個(gè)變量之間有線性關(guān)系;、各例觀測(cè)值丫i相互獨(dú)立;、殘差e服從均數(shù)為0,方差為2的正態(tài)分布。(等價(jià)于對(duì)任意一組自變量XI、X2Xm值,應(yīng)變量丫具有相同方差,并且服從正態(tài)分布)c、參數(shù)的計(jì)算方法:最小二乘法2、

23、多元線性回歸方程的假設(shè)檢驗(yàn)及其評(píng)價(jià):(對(duì)整體的假設(shè)檢驗(yàn))A、可以將回歸方程中所有的自變量作為一個(gè)整體來(lái)檢驗(yàn)它們與應(yīng)變量丫之間是否具有線性關(guān)系。假設(shè)檢驗(yàn)方法:方差分析法:H0:pl=p2=pm=0;Hl:各Bj不全為0.若拒絕H0,接受H1,即可確定所擬合的回歸方程有統(tǒng)計(jì)學(xué)意義。1)決定系數(shù)R2:即為偏回歸平方和與殘差平方和的比值,其值越接近1,說(shuō)明擬合程度越好。2)復(fù)相關(guān)系數(shù):決定系數(shù)開根號(hào),可用來(lái)度量應(yīng)變量與多個(gè)自變量之間的線性相關(guān)程度。B、各自變量的假設(shè)檢驗(yàn):、使用方法為偏回歸平方和(SS回(Xj):表示在仆1個(gè)自變量的基礎(chǔ)上新增加Xj所引起的回歸平方和的增加量。其值越大,說(shuō)明Xj越重要。

24、偏回歸平方和檢驗(yàn):H0:pj=0;Hl:內(nèi)工0注意:單獨(dú)分析各個(gè)變量的偏回歸平方和,所有值的和小于總的回歸平方和,其原因是忽略了各個(gè)變量之間的相互作用成分。、t檢驗(yàn)法:對(duì)于同一資料,不同自變量的t值間可以相互比較,t的絕對(duì)值越大,說(shuō)明該自變量對(duì)丫的回歸所起的作用越大。標(biāo)準(zhǔn)化回歸系數(shù):減少自變量觀測(cè)單位不同對(duì)結(jié)果的影響。在有統(tǒng)計(jì)學(xué)意義的前提下,標(biāo)準(zhǔn)化回歸系數(shù)的絕對(duì)值越大說(shuō)明相應(yīng)自變量對(duì)丫的作用越大。3、自變量選擇方法:A、全局擇優(yōu)法:、校正決定系數(shù)Rc選擇法(當(dāng)R2相同時(shí),自變量個(gè)數(shù)越多,Rc越小,最優(yōu)為Rc最大)、Cp選擇法:應(yīng)選擇Cp最接近P+1的回歸方程為最優(yōu)方程。Bs逐步選擇法:、前進(jìn)法

25、:(只選不剔)在有統(tǒng)計(jì)學(xué)意義的前提下,選取偏回歸平方和最大的一個(gè)自變量做F檢驗(yàn)以決定是否選入。、后退法:(只剔不選)選取回歸平方和最小的一個(gè)自變量做F檢驗(yàn)以決定是否剔除。、逐步回歸法:先選后剔,雙向篩選。本質(zhì)上是前進(jìn)法,但每引入一個(gè)自變量進(jìn)入方程后,要對(duì)方程中的每一個(gè)自變量做基于偏回歸平方和的F檢驗(yàn),看是否需要剔除一些退化為不顯著的自變量。注意:為了避免已經(jīng)剔除的自變量再次入選,選入自變量的檢驗(yàn)水準(zhǔn)要小于或等于剔除自變量的檢驗(yàn)水準(zhǔn)。第十六章logistic回歸分析logistic回歸(logisticregression)屬于概率型非線性回歸。適用對(duì)象:二分類或多分類影響因素之間的關(guān)系。Is表

26、示方法:陽(yáng)性概率P=l/l+exp(-Z)Z=PO+P1X1+P2X2+PmXmP的logit轉(zhuǎn)換:logitP=ln(p/l-p)=P0+P1X1+P2X2+PmXm回歸系數(shù)Bj表示自變量Xj改變一單位時(shí)logitP的該變量。2、模型參數(shù)的意義:、確定優(yōu)勢(shì)比(oddsratio,OR)衡量危險(xiǎn)因素作用大小的比數(shù)比例OR適用于分類指標(biāo)而不適用于計(jì)量指標(biāo);多變量調(diào)整后的優(yōu)勢(shì)比(adjustoddsratio)ORj:表示扣除了其他自變量影響后危險(xiǎn)因素的作用。用來(lái)對(duì)比某一危險(xiǎn)因素兩個(gè)不同暴露水平Xj=cl和Xj=cO之間的發(fā)病情況。Bj二0時(shí),ORj=l,說(shuō)明因素Xj對(duì)疾病的發(fā)生不起作用;Bjo時(shí)

27、,ORjl,說(shuō)明因素Xj對(duì)疾病發(fā)生起危險(xiǎn)作用;Bj0時(shí),ORj1,說(shuō)明因素Xj時(shí)保護(hù)因子。、確定相對(duì)危險(xiǎn)度(relativerisk,RR)對(duì)于發(fā)病率很低的疾病存在優(yōu)勢(shì)比即等于兩種暴露水平之間的相對(duì)危險(xiǎn)度。2、logistic回歸方程的參數(shù)估計(jì):主要方法有最大似然估計(jì)法(maximumlikelihoodestimate,MLE)和優(yōu)勢(shì)比估計(jì)法。3、logistic回歸的適用對(duì)象:、比較各暴露因素的致病風(fēng)險(xiǎn)的大??;、多因素的共同作用的評(píng)價(jià);、危險(xiǎn)因素的篩選:多經(jīng)文獻(xiàn)報(bào)道選取,但統(tǒng)計(jì)學(xué)資料不能代替專業(yè)依據(jù)4、logistic回歸模型的假設(shè)檢驗(yàn):常用的檢驗(yàn)方法有似然比檢驗(yàn)(likelihoodra

28、tiotest)、Wald檢驗(yàn)和計(jì)分檢驗(yàn)(scoretest)統(tǒng)計(jì)量為卡方值logistic回歸模型變量的篩選與多元線性回歸相同。第十七章生存分析Is生存分析資料與一般資料比較的不同:、同時(shí)考慮生存時(shí)間和生存結(jié)局;、通常含有刪失數(shù)據(jù);、生存時(shí)間的分布通常不服從正態(tài)分布。2、概念:生存時(shí)間(survivaltime),從起始事件到終點(diǎn)事之間所經(jīng)歷的時(shí)間跨度。完全數(shù)據(jù)(completedata),在追蹤觀察中,當(dāng)觀察到了某觀察對(duì)象的明確結(jié)局時(shí),該觀察對(duì)象所提供的關(guān)于生存時(shí)間的信息是完整的,這種生存時(shí)間數(shù)據(jù)稱為完全數(shù)據(jù)。不完全數(shù)據(jù)(incompletedata),在實(shí)際追蹤觀察中,由于某種原因無(wú)法知

29、道觀察對(duì)象的確切生存時(shí)間,這種生存時(shí)間數(shù)據(jù)也稱為截尾數(shù)據(jù)。生存率(survivalrate)是指病人經(jīng)歷給定的時(shí)間之后仍存活的概率,若有截尾數(shù)據(jù),應(yīng)用乘積極限法。生存概率(probabilityofsurvival)表示某段時(shí)段開始時(shí)存活的個(gè)體,到該時(shí)段結(jié)束時(shí)仍存活的可能性。死亡概率(probabilityofdeath)表示某段時(shí)段開始時(shí)存活的個(gè)體,到該時(shí)段結(jié)束時(shí)死亡的可能性。死亡率(deathrate)指的是某單位時(shí)間內(nèi)的平均死亡強(qiáng)度。四分位數(shù)間距:記為Q,表示中間半數(shù)病人生存期的分布范圍,它反映生存期的離散程度,其定義為:Q=T25-T75,式中,T25和T75分別是25百分位數(shù)和75百分位數(shù)3、生存率的估計(jì)與生存曲線:小樣本的生存率估計(jì):kaplan-Meier法(又稱乘積極限法)大樣本的生存率估計(jì)也可使用上述乘積極限法。4、生存率的比較:最常見的方法是使用log-rank檢驗(yàn)他稱為Mantel-Cox檢驗(yàn))其基本思想為實(shí)際死亡數(shù)與理論死亡數(shù)之間的比較。統(tǒng)計(jì)量為卡方值假設(shè)檢驗(yàn):H0:St(l)=St(2),即兩種方式的患者生存率相同;H1:兩種方式的患者生存率不同5、多因素生存分析方法:Cox比例風(fēng)險(xiǎn)模型(為半?yún)?shù)法)其參數(shù)的估計(jì)采用的方法為最大似然估計(jì)法因素的篩選與多元線

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論