理論分布和抽樣分布培訓(xùn)課程課件_第1頁
理論分布和抽樣分布培訓(xùn)課程課件_第2頁
理論分布和抽樣分布培訓(xùn)課程課件_第3頁
理論分布和抽樣分布培訓(xùn)課程課件_第4頁
理論分布和抽樣分布培訓(xùn)課程課件_第5頁
已閱讀5頁,還剩245頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

=0.由這些樣本算得的平均數(shù)有大有小,不盡相同,與原總體平均數(shù)μ相比往往表現(xiàn)出不同程度的差異。例如,一粒種子可能發(fā)芽也可能不發(fā)芽、隨機抽出一只動物可能是雌性也可能是雄性等,這類變量屬于間斷性隨機變量,其總體包括非此即彼的兩項對立事件,這樣的總體稱為二項總體。第二章理論分布和抽樣分布上式表示分布密度曲線下、橫軸上的全部面積為1。事件A的概率記為P(A)。如果(1)P(u<-)+P(u≥)第二章理論分布和抽樣分布(二)正態(tài)分布的特征例如,在編號為1、2、3、…、10的十頭豬中隨機抽取1頭,有10種不同的可能結(jié)果:“取得一個編號是1”、…,這10個事件都是不可能再分的事件。我們稱的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。當(dāng)總體標(biāo)準(zhǔn)差σ未知時,以樣本標(biāo)準(zhǔn)差S代替σ所得到的統(tǒng)計量記為t。第二章理論分布和抽樣分布

教學(xué)基本要求:了解幾種主要的理論分布和概率分布類型;理解小概率事件實際不可能性原理、樣本平均數(shù)的抽樣分布概念、t分布的概念;掌握正態(tài)分布標(biāo)準(zhǔn)化的方法以及正態(tài)分布概率的計算。教學(xué)重點難點:重點:小概率事件實際不可能性原理的概念,正態(tài)分布標(biāo)準(zhǔn)化的概念和方法及正態(tài)分布的概率計算方法。難點:正態(tài)分布標(biāo)準(zhǔn)化。教學(xué)建議:先復(fù)習(xí)概率論中有關(guān)內(nèi)容1=0.第二章理論分布和抽樣分布教學(xué)基本要求:1第二章理論分布和抽樣分布

2.1概率的統(tǒng)計學(xué)意義2.2小概率事件實際不可能性原理2.3理論分布2.4抽樣分布2.5t分布2第二章理論分布和抽樣分布2.1概率的統(tǒng)計學(xué)意義2第二章理論分布和抽樣分布為了便于理解統(tǒng)計分析的基本原理,正確掌握和應(yīng)用以后各章所介紹的統(tǒng)計分析方法,在上章樣本分布及其特征的基礎(chǔ)上本章將討論總體的分布及其特征。本章在介紹概率論中最基本的兩個概念——事件、概率的基礎(chǔ)上,重點介紹生物科學(xué)研究中常用的幾種隨機變量的概率分布:間斷性變數(shù)總體的理論分布:二項分布、泊松分布;連續(xù)性變數(shù)總體的理論分布,即正態(tài)分布;從這兩類理論分布中抽出的樣本統(tǒng)計數(shù)的分布,即抽樣分布和t分布。3第二章理論分布和抽樣分布為了便于理解統(tǒng)計分析的基本原理,2.1概率的統(tǒng)計學(xué)意義一、事件1.必然現(xiàn)象與隨機現(xiàn)象在自然界與生產(chǎn)實踐和科學(xué)試驗中,人們會觀察到各種各樣的現(xiàn)象,歸納起來大體上分為兩大類:必然現(xiàn)象:在保持條件不變的情況下,重復(fù)進(jìn)行試驗,其結(jié)果總是確定的,必然發(fā)生(或必然不發(fā)生),可預(yù)言其結(jié)果。隨機現(xiàn)象:在保持條件不變的情況下,重復(fù)進(jìn)行試驗,其結(jié)果未必相同,不可預(yù)言其結(jié)果。這類現(xiàn)象在個別試驗中其結(jié)果呈現(xiàn)偶然性、不確定性現(xiàn)象。42.1概率的統(tǒng)計學(xué)意義一、事件4一、攻關(guān)目標(biāo)2.1概率的統(tǒng)計學(xué)意義隨機現(xiàn)象有如下特點:在一定的條件實現(xiàn)時,有多種可能的結(jié)果發(fā)生,事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果;對一次或少數(shù)幾次觀察或試驗而言,其結(jié)果呈現(xiàn)偶然性、不確定性;但在相同條件下進(jìn)行大量重復(fù)試驗時,其試驗結(jié)果卻呈現(xiàn)出某種固有的特定的規(guī)律性——頻率的穩(wěn)定性,通常稱之為隨機現(xiàn)象的統(tǒng)計規(guī)律性。5一、攻關(guān)目標(biāo)2.1概率的統(tǒng)計學(xué)意義隨機現(xiàn)象有如下特點:2.1概率的統(tǒng)計學(xué)意義2.隨機試驗與隨機事件隨機試驗通常我們把根據(jù)某一研究目的,在一定條件下對自然現(xiàn)象所進(jìn)行的觀察或試驗統(tǒng)稱為試驗。而一個試驗如果滿足下述三個特性,則稱其為一個隨機試驗:隨機現(xiàn)象有如下特點:(1)試驗可以在相同條件下多次重復(fù)進(jìn)行;(2)每次試驗的可能結(jié)果不止一個,并且事先知道會有哪些可能的結(jié)果;(3)每次試驗總是恰好出現(xiàn)這些可能結(jié)果中的一個,但在一次試驗之前不能肯定這次試驗會出現(xiàn)哪一個結(jié)果。例如在一定孵化條件下,孵化6枚種蛋,觀察其出雛情況,具有隨機試驗的三個特征。62.1概率的統(tǒng)計學(xué)意義2.隨機試驗與隨機事件6一、攻關(guān)目標(biāo)2.1概率的統(tǒng)計學(xué)意義2.隨機試驗與隨機事件隨機事件

隨機試驗的每一種可能結(jié)果,在一定條件下可能發(fā)生,也可能不發(fā)生,稱為隨機事件,簡稱事件。(1)基本事件把不能再分的事件稱為基本事件。例如,在編號為1、2、3、…、10的十頭豬中隨機抽取1頭,有10種不同的可能結(jié)果:“取得一個編號是1”、…,這10個事件都是不可能再分的事件。由若干個基本事件組合而成的事件稱為復(fù)合事件。如“取得一個編號是2的倍數(shù)”是一個復(fù)合事件,它由5個基本事件組合而成。7一、攻關(guān)目標(biāo)2.1概率的統(tǒng)計學(xué)意義2.隨機試驗與隨機2.1概率的統(tǒng)計學(xué)意義2.隨機試驗與隨機事件隨機事件

(2)必然事件把在一定條件下必然會發(fā)生的事件稱為必然事件。例如,在嚴(yán)格按妊娠期母豬飼養(yǎng)管理的要求飼養(yǎng)的條件下,妊娠正常的母豬經(jīng)114天左右產(chǎn)仔,就是一個必然事件。(3)不可能事件

把在一定條件下不可能發(fā)生的事件稱為不可能事件。例如,在滿足一定孵化條件下,從石頭孵化出雛雞,就是一個不可能事件。必然事件與不可能事件實際上是確定性現(xiàn)象,即它們不是隨機事件,但是為了方便起見,我們把它們看作為兩個特殊的隨機事件。82.1概率的統(tǒng)計學(xué)意義2.隨機試驗與隨機事件82.1概率的統(tǒng)計學(xué)意義二、概率(一)概率的統(tǒng)計定義

研究隨機試驗,僅知道可能發(fā)生哪些隨機事件是不夠的,還需了解各種隨機事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計規(guī)律性,從而指導(dǎo)實踐。這就要求有一個能夠刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo),這指標(biāo)應(yīng)該是事件本身所固有的,且不隨人的主觀意志而改變,人們稱之為概率(probability)。事件A的概率記為P(A)。92.1概率的統(tǒng)計學(xué)意義二、概率92.1概率的統(tǒng)計學(xué)意義事件發(fā)生的可能性(概率)是在大量的實驗中觀察得到的,例如棉田發(fā)生盲椿象為害的情況,并不是所有的棉株都受害,隨著觀察的次數(shù)增多,我們對棉株受害可能性程度大小的把握越準(zhǔn)確、越穩(wěn)定,棉株受害為隨機事件。下表為一個調(diào)查結(jié)果:

102.1概率的統(tǒng)計學(xué)意義事件發(fā)生的可能性(概率)是在大量2.1概率的統(tǒng)計學(xué)意義從棉株受害情況調(diào)查結(jié)果看,頻率在n取不同的值時,盡管調(diào)查田塊是相同的,頻率p卻不同,只有在n很大時頻率才比較穩(wěn)定一致。因而,調(diào)查株數(shù)n較多時的穩(wěn)定頻率才能較好地代表棉株受害的可能性。統(tǒng)計學(xué)上把通過大量實驗而估計的概率稱為實驗概率或統(tǒng)計概率,用n較大時穩(wěn)定的p近似代表概率,稱為隨機事件A的概率:P(A)=p≈m/n(n→∞)此處P代表概率,P(A)代表事件A的概率。112.1概率的統(tǒng)計學(xué)意義從棉株受害情況調(diào)查結(jié)果看,頻率在2.1概率的統(tǒng)計學(xué)意義然而,正如此試驗中出現(xiàn)的情況,盡管頻率比較穩(wěn)定,但仍有較小的數(shù)值波動,說明觀察的頻率只是對棉株受害這個事件的概率的估計。122.1概率的統(tǒng)計學(xué)意義然而,正如此試驗中出現(xiàn)的情況,盡2.1概率的統(tǒng)計學(xué)意義(二)概率的古典定義

對于某些隨機事件,用不著進(jìn)行多次重復(fù)試驗來確定其概率,而是根據(jù)隨機事件本身的特性直接計算其概率。有很多隨機試驗具有以下特征:

1、試驗的所有可能結(jié)果(基本事件數(shù))只有有限個;

2、各個試驗的可能結(jié)果出現(xiàn)的可能性相等,即所有基本事件的發(fā)生是等可能的;

3、試驗的所有可能結(jié)果兩兩互不相容。具有上述特征的隨機試驗,稱為古典概型。132.1概率的統(tǒng)計學(xué)意義(二)概率的古典定義132.1概率的統(tǒng)計學(xué)意義對于古典概型,概率的定義如下:設(shè)樣本空間由n個等可能的基本事件所構(gòu)成,其中事件A包含有m個基本事件,則事件A的概率為m/n,即

P(A)=m/n這樣定義的概率稱為古典概率。142.1概率的統(tǒng)計學(xué)意義對于古典概型,概率的定義如下:1例:求=0.第六節(jié)樣本平均數(shù)的抽樣分布5時,分布趨于對稱;μt=0(df>1)的總體平均數(shù)記為、總體方差記為,的抽樣總體標(biāo)準(zhǔn)差簡稱總體標(biāo)準(zhǔn)誤,表示平均數(shù)抽樣誤差的大小。當(dāng)概率P一定時,隨著df的增加,臨界t值在減小,當(dāng)df=∞時,臨界t值與標(biāo)準(zhǔn)正態(tài)分布的臨界u值相等。從N頭奶牛中任意抽出n頭奶牛的基本事件總數(shù)為;相應(yīng)的累積分布函數(shù)為:2α=1-P(-≤u<)=1-0.一、正態(tài)分布的定義及其特征P(-2≤u<2)=0.2.1概率的統(tǒng)計學(xué)意義例如,在有兩個孩子的家庭中,孩子性別的組成有四種類型。即:男男、男女、女男、女女。它們是四個基本事件,而且是互不相容且等可能的,那么兩個男孩的事件A1為四個基本事件(n)中的一個(m),A1的概率P(A1)=1/4

=0.25第一個是男孩的事件A2,包括男男,男女兩個基本事件。A2的概率P(A2)=2/4

=0.5015例:求=0.2.1概率的統(tǒng)計學(xué)意義例如,2.1概率的統(tǒng)計學(xué)意義概率的古典定義是在概率論發(fā)展史上早期提出來的,它存在嚴(yán)重缺點。首先,它要求各基本事件是等可能的,即等概率的。在尚未給出概率的定義之前,利用概率的概念定義概率是不可取的。其次,它存在很大的局限性,只適用于基本事件數(shù)是有限的一類試驗,對于基本事件數(shù)是無限的一類就無能為力了。雖然如此,在實際應(yīng)用中,它還是被廣泛地使用。

162.1概率的統(tǒng)計學(xué)意義概率的古典定義是在概率論發(fā)展史上2.1概率的統(tǒng)計學(xué)意義例

在N頭奶牛中,有M頭曾有流產(chǎn)史,從這群奶牛中任意抽出n頭奶牛,試求:(1)其中恰有m頭有流產(chǎn)史奶牛的概率是多少?(2)若N=30,M=8,n=10,m=2,其概率是多少?172.1概率的統(tǒng)計學(xué)意義例在N頭奶牛中,有M頭曾有流2.1概率的統(tǒng)計學(xué)意義我們把從有M頭奶牛曾有流產(chǎn)史的N頭奶牛中任意抽出n頭奶牛,其中恰有m頭有流產(chǎn)史這一事件記為A,因為從N頭奶牛中任意抽出n頭奶牛的基本事件總數(shù)為;事件A所包含的基本事件數(shù)為;因此所求事件A的概率為:182.1概率的統(tǒng)計學(xué)意義我們把從有M頭奶牛曾有流產(chǎn)史的N一、攻關(guān)目標(biāo)2.1概率的統(tǒng)計學(xué)意義將N=30,M=8,n=10,m=2代入上式,得

=0.0695

即在30頭奶牛中有8頭曾有流產(chǎn)史,從這群奶牛隨機抽出10頭奶牛其中有2頭曾有流產(chǎn)史的概率為6.95%。19一、攻關(guān)目標(biāo)2.1概率的統(tǒng)計學(xué)意義將N=30,M=82.1概率的統(tǒng)計學(xué)意義(三)概率的性質(zhì)

1、對于任何事件A,有0≤P(A)≤1;

2、必然事件的概率為1,即P(Ω)=1;

3、不可能事件的概率為0,即P(ф)=0。202.1概率的統(tǒng)計學(xué)意義(三)概率的性質(zhì)20一、攻關(guān)目標(biāo)2.2小概率事件實際不可能性原理隨機事件的概率表現(xiàn)了事件的客觀統(tǒng)計規(guī)律性,它反映了事件在一次試驗中發(fā)生可能性的大小,概率大表示事件發(fā)生的可能性大,概率小表示事件發(fā)生的可能性小。若隨機事件的概率很小,例如小于0.05、0.01、0.001,稱之為小概率事件。21一、攻關(guān)目標(biāo)2.2小概率事件實際不可能性原理隨機事件的概一、攻關(guān)目標(biāo)2.2小概率事件實際不可能性原理在統(tǒng)計學(xué)上,把小概率事件在一次試驗中看成是實際不可能發(fā)生的事件稱為小概率事件實際不可能性原理,亦稱為小概率原理。小概率事件實際不可能性原理是統(tǒng)計學(xué)上進(jìn)行假設(shè)檢驗(顯著性檢驗)的基本依據(jù)。這里的0.05或0.01稱為小概率標(biāo)準(zhǔn),生物試驗研究中通常使用這兩個小概率標(biāo)準(zhǔn)。22一、攻關(guān)目標(biāo)2.2小概率事件實際不可能性原理在統(tǒng)計學(xué)上,2.3理論分布事件的概率表示了一次試驗?zāi)骋粋€結(jié)果發(fā)生的可能性大小。若要全面了解試驗,則必須知道試驗的全部可能結(jié)果及各種可能結(jié)果發(fā)生的概率,即必須知道隨機試驗的概率分布(probabilitydistribution)。為了深入研究隨機試驗,我們先引入隨機變量(randomvariable)的概念。232.3理論分布事件的概率表示了一次試驗?zāi)骋粋€結(jié)果發(fā)生的2.3理論分布第一節(jié)、隨機變量隨機變量就是在隨機試驗中被測定的量。例如,觀察10只新生動物的性別是一隨機試驗,而其中雄性動物出現(xiàn)的只數(shù)Y,就是在隨機試驗中被測定的量,Y可取0,1,…,10中的任何值。但是它究竟取何值,在試驗結(jié)束之前是不能確知的。一般來說,在隨機試驗中,被測定的量是可取不同值的變量,而且它究竟取何值具有隨機性,我們稱這樣的量為隨機變量。隨機變量所取得的值稱為觀測值。

242.3理論分布第一節(jié)、隨機變量242.3理論分布有時隨機試驗結(jié)果本身就是數(shù)量,如測量我國男青年身高本身就是數(shù)量。有時,隨機試驗的結(jié)果本身不是數(shù)量,但可以表示為數(shù)量。如觀察每10只新生動物的性別,本身并不是數(shù)量,但可以記為10只動物中雄性動物的只數(shù)或雌性動物的只數(shù),即試驗結(jié)果可以表示為數(shù)量。這個數(shù)量的具體值,同樣是由隨機試驗的結(jié)果而確定。

252.3理論分布有時隨機試驗結(jié)果本身就是數(shù)量,如測量我國2.3理論分布根據(jù)隨機變量可能取得的值,可將隨機變量分為離散型隨機變量和連續(xù)型隨機變量:如果隨機變量可能取得的數(shù)值為有限個,或可數(shù)無窮個孤立的數(shù)值,且以各種確定的概率取這些不同的值,則稱為離散型隨機變量。例如,每10只新生動物中,雄性動物的只數(shù)。如果隨機變量可取某一(有限或無限)區(qū)間內(nèi)的任何數(shù)值,且Y其取值范圍內(nèi)的任一區(qū)間中取值時,其概率是確定的,則稱為連續(xù)型隨機變量。例如我國男青年身高即為一連續(xù)型隨機變量。262.3理論分布根據(jù)隨機變量可能取得的值,可將隨機變量分2.3理論分布隨機變量可能取值的全體稱為總體,其n次獨立觀測值,稱為樣本。本書均以大寫的拉丁字母,如X,Y,U等表示隨機變量,而以小寫字母如、等表示第i次觀測值。有了隨機變量的概念,事件就可以用隨機變量的關(guān)系式表示。如在10只動物中,出現(xiàn)3只和3只以下雄性動物的事件即可寫為Y≤3。272.3理論分布隨機變量可能取值的全體稱為總體,其n次獨2.3理論分布離散型隨機變量的概率分布要了解離散型隨機變量Y的統(tǒng)計規(guī)律,就必須知道它的一切可能值yi及取每種可能值的概率pi。如果將離散型隨機變量Y的一切可能取值y的概率P(Y=y)寫成y的函數(shù)稱為隨機變量Y的概率函數(shù):p(y)=P(Y=y)(2.16)概率函數(shù)應(yīng)滿足p(y)≥0,(2.17)

282.3理論分布離散型隨機變量的概率分布28第二章理論分布和抽樣分布

將Y的一切可能值,,…,以及取得這些值的概率、…,排列起來,就構(gòu)成了離散型隨機變量的概率分布(probabiitdistribution)。表2-2離散型隨機變量的概率分布表。

Y

P(yi)

29第二章理論分布和抽樣分布將Y的一切可能值,2.3理論分布連續(xù)型隨機變量的概率分布

連續(xù)型隨機變量(如體長、體重、)的概率分布不能用上述分布表來表示,因為其可能取的值是不可數(shù)的。我們改用隨機變量Y在某個區(qū)間內(nèi)取值的概率P(a≤Y<b)來表示。下面通過頻率分布密度曲線予以說明。302.3理論分布連續(xù)型隨機變量的概率分布302.3理論分布如由140行水稻產(chǎn)量資料的頻數(shù)分布方柱形圖(圖3—1),圖中縱座標(biāo)取頻數(shù)與組距的比值。可以設(shè)想,如果樣本取得越來越大(n→∞),組分得越來越細(xì)(i→0),某一范圍內(nèi)的頻率將趨近于一個穩(wěn)定值──概率。這時,頻率分布方柱形圖各個方柱上端中點的聯(lián)線──頻率分布折線將逐漸趨向于一條曲線,換句話說,當(dāng)n→∞、i→0時,頻數(shù)分布折線的極限是一條穩(wěn)定的函數(shù)曲線。312.3理論分布如由140行水稻產(chǎn)量資料的頻數(shù)分布方柱形第二章理論分布和抽樣分布

32第二章理論分布和抽樣分布32第二章理論分布和抽樣分布

對于樣本是取自連續(xù)型隨機變量的情況,這條函數(shù)曲線將是光滑的。這條曲線排除了抽樣和測量的誤差,完全反映了水稻行產(chǎn)量的變動規(guī)律。這條曲線叫概率分布曲線,相應(yīng)的函數(shù)f(y)叫概率密度函數(shù)

。33第二章理論分布和抽樣分布對于樣本是取自連續(xù)型隨機變量的2.3理論分布若記產(chǎn)量概率分布密度函數(shù)為f(y),則y取值于區(qū)間(a,b)的概率為:

上式為連續(xù)型隨機變量Y在區(qū)間(a,b)上取值概率的表達(dá)式??梢?,連續(xù)型隨機變量的概率由概率分布密度函數(shù)確定。

342.3理論分布若記產(chǎn)量概率分布密度函數(shù)為f(y),則y第二章理論分布和抽樣分布

連續(xù)型隨機變量概率分布的性質(zhì):

1、分布密度函數(shù)總是大于或等于0,即f(y)≥0;

2、當(dāng)隨機變量Y取某一特定值時,其概率等于0;即

(c為任意實數(shù))

因而,對于連續(xù)型隨機變量,僅研究其在某一個區(qū)間內(nèi)取值的概率,而不去討論取某一個值的概率。35第二章理論分布和抽樣分布連續(xù)型隨機變量概率分布的性質(zhì):第二章理論分布和抽樣分布

3、在一次試驗中隨機變量Y之取值必在-∞<Y<+∞范圍內(nèi),為一必然事件。所以

上式表示分布密度曲線下、橫軸上的全部面積為1。36第二章理論分布和抽樣分布3、在一次試驗中隨機變量2.3理論分布第二節(jié)二項分布一、二項分布的概念在生物學(xué)研究中,有這樣一類常見的變量,其總體中的全部個體可以根據(jù)某種性狀的出現(xiàn)與否分為兩類。例如,一粒種子可能發(fā)芽也可能不發(fā)芽、隨機抽出一只動物可能是雌性也可能是雄性等,這類變量屬于間斷性隨機變量,其總體包括非此即彼的兩項對立事件,這樣的總體稱為二項總體。372.3理論分布第二節(jié)二項分布372.3理論分布為便于研究,通常將二項總體中的“此”事件以變量“1”表示,具概率

;將“彼”事件以變量“0”表示,具概率。因而二項總體又稱為0、1總體。382.3理論分布為便于研究,通常將二項總體中的“此”事件2.3理論分布如果從二項總體抽取n個個體,可能得到y(tǒng)個個體屬于“此”,而屬于“彼”的個體為n-y。由于是隨機獨立地從總體中抽取個體的,每一次抽取的個體均有可能屬于“此”,也可能屬于“彼”,那么得到的y個“此”個體的數(shù)目可能為0、1、2、…、n個,共有n+l種取值,這n+l種取值各有其對應(yīng)的概率,因而由變量及其概率就構(gòu)成了一個分布,這個分布叫做二項式概率分布,簡稱二項式分布或二項分布(binomialdistribution)。392.3理論分布如果從二項總體抽取n個個體,可能得到y(tǒng)個2.3理論分布動物的性別比一般為1∶1,即?,F(xiàn)從一動物群體中進(jìn)行隨機抽樣,共抽取10次,則抽到3只雄性動物的概率可分析為:在10次抽樣中,抽到3雄7雌的組合方式數(shù)為:而每種抽樣方式中,10次抽樣得到3只雄性的概率為:所以抽取10次,抽到3只雄性動物的概率為:402.3理論分布動物的性別比一般為1∶1,即2.3理論分布對于任意n和y,則可寫成通式:上式正是二項式展開式的第y+1項,故稱二項分布,上式稱作二項概率公式。因為,所以:412.3理論分布對于任意n和y,則可寫成通式:412.3理論分布二、二項分布的性質(zhì)1、二項分布的概率之和等于12、二項分布由n和

兩個參數(shù)決定:當(dāng)值較小且n不大時,分布是偏倚的。但隨著n的增大,分布逐漸趨于對稱;當(dāng)

值趨于0.5時,分布趨于對稱;在n較大,

較接近時,二項分布接近于正態(tài)分布;當(dāng)n→∞時,二項分布的極限分布是正態(tài)分布。422.3理論分布二、二項分布的性質(zhì)422.3理論分布432.3理論分布432.3理論分布三、二項分布的概率計算例1一批種子發(fā)芽率為70%,每穴播種6粒種子,計算每穴出6棵苗、5、4、3、2、1、0棵苗的概率各為多少?解:設(shè)y表示每穴出苗數(shù)

442.3理論分布三、二項分布的概率計算442.3理論分布例2純種白豬與純種黑豬雜交,根據(jù)孟德爾遺傳理論,子二代中白豬與黑豬的比率為3∶1。求窩產(chǎn)仔10頭,有7頭白豬的概率。根據(jù)題意,n=10,=0.75,。設(shè)10頭仔豬中白色的為y頭,則y為服從二項分布B(10,0.75)的隨機變量。于是窩產(chǎn)10頭仔豬中有7頭是白色的概率為:452.3理論分布例2純種白豬與純種黑豬雜交,根據(jù)孟德2.3理論分布例3設(shè)在家畜中感染某種疾病的概率為20%,現(xiàn)有兩種疫苗,用疫苗A注射了15頭家畜后無一感染,用疫苗B注射15頭家畜后有1頭感染。設(shè)各頭家畜沒有相互傳染疾病的可能,問:應(yīng)該如何評價這兩種疫苗?

假設(shè)疫苗A完全無效,那么注射后的家畜感染的概率仍為20%,則15頭家畜中染病頭數(shù)y=0的概率為:462.3理論分布例3設(shè)在家畜中感染某種疾病的概率為22.3理論分布同理,如果疫苗B完全無效,則15頭家畜中最多有1頭感染的概率為:由計算可知,注射A疫苗無效的概率為0.0352,比B疫苗無效的概率0.1671小得多。因此,可以認(rèn)為A疫苗是有效的,但不能認(rèn)為B疫苗也是有效的。472.3理論分布同理,如果疫苗B完全無效,則15頭家畜中2.3理論分布在輻射育種實驗中,已知經(jīng)過處理的單株至少發(fā)生一個有利突變的概率是,群體中至少出現(xiàn)一株有利突變單株的概率為,問為了至少得到一株有利突變的單株,群體n應(yīng)多大?解:己知為單株至少發(fā)生一個有利突變的概率則為單株不發(fā)生一個有利突變的概率

482.3理論分布在輻射育種實驗中,已知經(jīng)過處理的單株至少第二章理論分布和抽樣分布

四、二項分布的平均數(shù)與標(biāo)準(zhǔn)差統(tǒng)計學(xué)證明,服從二項分布B(n,)的隨機變量的平均數(shù)μ、標(biāo)準(zhǔn)差σ與參數(shù)n、

有如下關(guān)系:當(dāng)試驗結(jié)果以事件A發(fā)生次數(shù)k表示時

49第二章理論分布和抽樣分布四、二項分布的平均數(shù)與標(biāo)準(zhǔn)差4第二章理論分布和抽樣分布

例:

求=0.2,n=5時的平均死亡豬數(shù)及死亡數(shù)的標(biāo)準(zhǔn)差。平均死亡豬數(shù)μ=5×0.20=1.0(頭)

標(biāo)準(zhǔn)差

=0.894(頭)50第二章理論分布和抽樣分布例:求=0.2,第二章理論分布和抽樣分布

當(dāng)試驗結(jié)果以事件A發(fā)生的頻率k/n表示時

也稱為總體百分?jǐn)?shù)標(biāo)準(zhǔn)誤。51第二章理論分布和抽樣分布當(dāng)試驗結(jié)果以事件A發(fā)生的頻率k2.3理論分布第三節(jié)泊松分布泊松分布是一種可以用來描述和分析隨機地發(fā)生在單位空間或時間里的稀有事件的概率分布。要觀察到這類事件,樣本含量n必須很大。在生物學(xué)研究中,服從泊松分布的隨機變量是常見的。如,一定群體中某種患病率很低的非傳染性疾病患病數(shù)或死亡數(shù),群體中遺傳的畸形怪胎數(shù),每升飲水中大腸桿菌數(shù),計數(shù)器小方格中血球數(shù),單位空間中某些野生動物或昆蟲數(shù)等,都是服從泊松分布的。522.3理論分布第三節(jié)泊松分布522.3理論分布一、泊松分布的意義在二項分布中,當(dāng)某事件出現(xiàn)的概率特別小(),而樣本含量又很大()且時,二項分布就變成泊松分布(Poissondistribution),具有概率密度函數(shù):其中

;e=2.7182…是自然對數(shù)的底數(shù),稱y服從參數(shù)為的泊松分布,記為~。532.3理論分布一、泊松分布的意義532.3理論分布二、泊松分布的特征數(shù)泊松分布的平均數(shù):即泊松分布的平均數(shù)為概率密度函數(shù)中的。泊松分布的方差:即泊松分布的方差為概率密度函數(shù)中的。所以,泊松分布具有重要特征:平均數(shù)和方差相等,都等于常數(shù)。泊松分布的偏斜度:泊松分布的峭度:當(dāng)(≥20)很大時,泊松分布近似于正態(tài)分布。542.3理論分布二、泊松分布的特征數(shù)542.3理論分布例

調(diào)查某種豬場閉鎖育種群仔豬畸形數(shù),共記錄200窩,畸形仔豬數(shù)的分布情況如表所示。試判斷畸形仔豬數(shù)是否服從泊松分布。樣本均數(shù)和方差:樣本均數(shù)和方差兩個數(shù)是相當(dāng)接近的,因此可以認(rèn)為畸形仔豬數(shù)服從泊松分布。552.3理論分布例調(diào)查某種豬場閉鎖育種群仔豬畸形數(shù),2.3理論分布將代替公式中的得:

e-0.51=1.6653,畸形仔豬數(shù)各項的概率為:P(y=0)=0.510/(0!×1.6653)=0.6005P(y=1)=0.511/(1!×1.6653)=0.3063P(y=2)=0.512/(2!×1.6653)=0.0781P(y=3)=0.513/(3!×1.6653)=0.0133P(y=4)=0.514/(4!×1.6653)=0.0017把上面各項概率乘以總觀察窩數(shù)(n=200)即得各項按泊松分布的理論窩數(shù)。562.3理論分布將代替公式中的2.3理論分布表

畸形仔豬數(shù)的泊松分布將實際計算得的頻率與根據(jù)=0.51的泊松分布計算的概率相比較,發(fā)現(xiàn)畸形仔豬的頻率分布與=0.51的泊松分布是吻合得很好的。這進(jìn)一步說明了畸形仔豬數(shù)是服從泊松分布的。572.3理論分布表畸形仔豬數(shù)的泊松分布572.3理論分布第三節(jié)泊松分布P47例3.5582.3理論分布第三節(jié)泊松分布582.3理論分布例

為監(jiān)測飲用水的污染情況,現(xiàn)檢驗?zāi)成鐓^(qū)每毫升飲用水中細(xì)菌數(shù),共得400個記錄如下:試分析飲用水中細(xì)菌數(shù)的分布是否服從泊松分布。若服從,按泊松分布計算每毫升水中細(xì)菌數(shù)的概率及理論次數(shù)并將頻率分布與泊松分布作直觀比較。592.3理論分布例為監(jiān)測飲用水的污染情況,現(xiàn)檢驗?zāi)?.3理論分布經(jīng)計算得每毫升水中平均細(xì)菌數(shù)和方差:兩者很接近,故可認(rèn)為每毫升水中細(xì)菌數(shù)服從泊松分布。將代替公式中的得:計算結(jié)果如下表:602.3理論分布經(jīng)計算得每毫升水中平均細(xì)菌數(shù)和方差:602.3理論分布表

細(xì)菌數(shù)的泊松分布可見細(xì)菌數(shù)的頻率分布與的泊松分布是相當(dāng)吻合的,進(jìn)一步說明用泊松分布描述單位容積(或面積)中細(xì)菌數(shù)的分布是適宜的。612.3理論分布表細(xì)菌數(shù)的泊松分布612.3理論分布第四節(jié)正態(tài)分布正態(tài)分布是一種很重要的連續(xù)型隨機變量的概率分布。生物現(xiàn)象中有許多變量是服從或近似服從正態(tài)分布的。許多統(tǒng)計分析方法都是以正態(tài)分布為基礎(chǔ)的。此外,還有不少隨機變量的概率分布在一定條件下以正態(tài)分布為其極限分布。因此在統(tǒng)計學(xué)中,正態(tài)分布無論在理論研究上還是實際應(yīng)用中,均占有重要的地位。622.3理論分布第四節(jié)正態(tài)分布622.3理論分布一、正態(tài)分布的定義及其特征

(一)正態(tài)分布的定義若連續(xù)型隨機變量Y的概率分布密度函數(shù)為:

其中μ為平均數(shù),為方差,則稱隨機變量Y服從正態(tài)分布(normaldistribution),記為Y~N(μ,)。632.3理論分布一、正態(tài)分布的定義及其特征632.3理論分布642.3理論分布642.3理論分布對于任意正態(tài)分布,隨機變量Y的值落入任意區(qū)間(a,b)的概率為:相應(yīng)的累積分布函數(shù)為:652.3理論分布對于任意正態(tài)分布,隨機變量Y的值落入任意2.3理論分布(二)正態(tài)分布的特征

1、正態(tài)分布密度曲線是單峰、對稱的懸鐘形曲線,對稱軸為y=μ;

2、f(y)在y=μ處達(dá)到極大,極大值;

3、f(y)是非負(fù)函數(shù),以x軸為漸近線,分布從-∞至+∞;

4、曲線在y=μ±σ處各有一個拐點,即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上是下凸的,在[μ-σ,μ+σ]區(qū)間內(nèi)是上凸的;

5、正態(tài)分布有兩個參數(shù),即平均數(shù)μ和標(biāo)準(zhǔn)差σ。

μ是位置參數(shù),如圖4—8所示。當(dāng)σ恒定時,μ愈大,則曲線沿x軸愈向右移動;反之,μ愈小,曲線沿x軸愈向左移動。

σ是變異度參數(shù),如圖4—9所示。6、分布密度曲線與橫軸所夾的面積為1,662.3理論分布(二)正態(tài)分布的特征662.3理論分布二、標(biāo)準(zhǔn)正態(tài)分布

由上述正態(tài)分布的特征可知,正態(tài)分布是依賴于參數(shù)μ和

(或σ)的一簇分布,正態(tài)曲線之位置及形態(tài)隨μ和的不同而不同。這就給研究具體的正態(tài)總體帶來困難。以一個新變數(shù)u替代y變數(shù),即將y離其平均數(shù)的差數(shù),以σ為單位進(jìn)行轉(zhuǎn)換,于是。

u稱為標(biāo)準(zhǔn)正態(tài)離差。672.3理論分布二、標(biāo)準(zhǔn)正態(tài)分布672.3理論分布由之可將正態(tài)分布的概率密度函數(shù)標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)為:我們稱的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。記作u~N(0,1)。累積分布函數(shù)為:

682.3理論分布由之可將正態(tài)分布的概率密度函數(shù)標(biāo)準(zhǔn)化為標(biāo)2.3理論分布692.3理論分布692.3理論分布三、正態(tài)分布的概率計算(一)標(biāo)準(zhǔn)正態(tài)分布的概率計算

設(shè)u服從標(biāo)準(zhǔn)正態(tài)分布,則u在[u1,u2)內(nèi)取值的概率為:

=Φ(u2)-Φ(u1)Φ(u1)與Φ(u2)可由附表2查得。702.3理論分布三、正態(tài)分布的概率計算702.3理論分布由公式及正態(tài)分布的對稱性可推出下列關(guān)系式,再借助附表2,便能很方便地計算有關(guān)概率:

P(0≤U<u1)=Φ(u1)-0.5

P(U≥u1)=Φ(-u1)

P(|U|≥u1)=2Φ(-u1)

P(|U|<u1==1-2Φ(-u1)

P(u1≤U<u2)=Φ(u2)-Φ(u1)712.3理論分布由公式及正態(tài)分布的對稱性可推出下列關(guān)系式2.3理論分布例

已知u~N(0,1),試求:

(1)P(u<-1.64)=?(2)P(u≥2.58)=?(3)P(|u|≥2.56)=?(4)P(0.34≤u<1.53)=?722.3理論分布例已知u~N(0,1),試求:722.3理論分布查附表2得:

(1)P(u<-1.64)=0.05050(2)P(u≥2.58)=Φ(-2.58)=0.024940(3)P(|u|≥2.56)=2Φ(-2.56)=2×0.005234=0.010468(4)P(0.34≤u<1.53)=Φ(1.53)-Φ(0.34)=0.93669-0.6331=0.30389732.3理論分布查附表2得:732.3理論分布742.3理論分布742.3理論分布關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:

P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545

P(-3≤u<3)=0.9973P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99752.3理論分布關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:2.3理論分布u變量在上述區(qū)間以外取值的概率分別為:

P(|u|≥1)=2Φ(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2Φ(-2)=1-P(-2≤u<2)

=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01762.3理論分布u變量在上述區(qū)間以外取值的概率分別為:72.3理論分布(二)一般正態(tài)分布的概率計算

正態(tài)分布密度曲線和橫軸圍成的一個區(qū)域,其面積為1,這實際上表明了“隨機變量Y取值在-∞與+∞之間”是一個必然事件,其概率為1。若隨機變量Y服從正態(tài)分布N(μ,σ2),則Y的取值落在任意區(qū)間[y1,y2)的概率,記作P(y1≤Y<y2),等于圖中陰影部分曲邊梯形面積。772.3理論分布(二)一般正態(tài)分布的概率計算772.3理論分布782.3理論分布782.3理論分布對上式作變換u=(y-μ)/σ,得dy=σdu,故有:其中,792.3理論分布792.3理論分布這表明服從正態(tài)分布N(μ,σ2)的隨機變量Y在[y1,y2)內(nèi)取值的概率,等于服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量u在[(y1-μ)/σ,(y2-μ)/σ)內(nèi)取值的概率。因此,計算一般正態(tài)分布的概率時,只要將區(qū)間的上下限作適當(dāng)變換(標(biāo)準(zhǔn)化),就可用查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求得概率了。802.3理論分布這表明服從正態(tài)分布N(μ,σ2)的隨機變2.3理論分布例

設(shè)Y服從μ=30.26,σ2=5.102的正態(tài)分布,試求P(21.64≤Y<32.98)。令則u服從標(biāo)準(zhǔn)正態(tài)分布,故

=P(-1.69≤u<0.53)=Φ(0.53)-Φ(-1.69)=0.7019-0.04551=0.6564812.3理論分布例設(shè)Y服從μ=30.26,σ2=5.2.3理論分布關(guān)于一般正態(tài)分布,以下幾個概率(即隨機變量Y落在μ加減不同倍數(shù)σ區(qū)間的概率)是經(jīng)常用到的。

P(μ-σ≤Y<μ+σ)=0.6826P(μ-2σ≤Y<μ+2σ)=0.9545P(μ-3σ≤Y<μ+3σ)=0.9973P(μ-1.96σ≤Y<μ+1.96σ)=0.95P(μ-2.58σ≤Y<μ+2.58σ)=0.99822.3理論分布關(guān)于一般正態(tài)分布,以下幾個概率(2.3理論分布四、正態(tài)分布的單側(cè)臨界值生物統(tǒng)計中,不僅注意隨機變量Y落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間(μ-kσ,μ+kσ)之內(nèi)的概率,而且也很關(guān)心Y落在此區(qū)間之外的概率。我們把隨機變量Y落在平均數(shù)μ加減不同倍數(shù)標(biāo)準(zhǔn)差σ區(qū)間之外的概率稱為雙側(cè)概率(兩尾概率),記作α。832.3理論分布四、正態(tài)分布的單側(cè)臨界值832.3理論分布對應(yīng)于雙側(cè)概率可以求得隨機變量Y小于μ-kσ或大于μ+kσ的概率,稱為單側(cè)概率(一尾概率),記作α/2。例如,Y落在(μ-1.96σ,μ+1.96σ)之外的雙側(cè)概率為0.05,而單側(cè)概率為0.025。即

P(y<μ-1.96σ)=P(y>μ+1.96σ)=0.025

雙側(cè)概率或單側(cè)概率如圖3—7所示。

y落在(μ-2.58σ,μ+2.58σ)之外的雙側(cè)概率為0.01,而單側(cè)概率為0.005。即

P(x<μ-2.58σ)=P(x>+2.58σ)=0.005842.3理論分布對應(yīng)于雙側(cè)概率可以求得隨機變量Y小于μ-2.3理論分布

852.3理論分布852.3理論分布附表3給出了滿足的上側(cè)分位的數(shù)值,稱為的上側(cè)臨界值,也稱上側(cè)分位數(shù),位丁曲線的右側(cè)尾區(qū);對于左側(cè)尾區(qū),滿足的下側(cè)分位的數(shù)值,稱為的下側(cè)臨界值,也稱下側(cè)分位數(shù)。因此,只要已知單側(cè)概率α的值,由附表3就可直接查出對應(yīng)的單側(cè)分位數(shù)。例如,已知u~N(0,1):

(1)P(u<-1.645)+P(u≥1.645)=0.05

(2)P(-1.645≤u<1.645)=0.90

862.3理論分布附表3給出了滿足2.3理論分布如果(1)P(u<-)+P(u≥)=1-P(-≤u<﹚=0.10=2α側(cè)由附表3查得:=1.645(2)P(-≤u<)=0.86,

2α=1-P(-≤u<)=1-0.86=0.14

由附表3查得:=1.476

對于x~N(μ,σ2),只要將其轉(zhuǎn)換為u~N(0,1),即可求得相應(yīng)的雙側(cè)分位數(shù)。872.3理論分布如果(1)P(u<-)+2.3理論分布前面討論的三個重要的概率分布中,前一個屬連續(xù)型隨機變量的概率分布,后兩個屬離散型隨機變量的概率分布。三者間的關(guān)系如下:對于二項分布,在n→∞,p→0,且np=μ(較小常數(shù))情況下,二項分布趨于泊松布,在這種場合,泊松分布中的參數(shù)μ用二項分布的np代之;在n→∞,p→0.5時,二項分布趨于正態(tài)分布,在這種場合,正態(tài)分布中的μ、σ2用二項分布的np、nq代之。在實際計算中,當(dāng)p<0.1且n很大時,二項分布可由泊松分布近似;當(dāng)p>0.1且n很大時,二項分布可由正態(tài)分布近似。882.3理論分布前面討論的三個重要的概率分布中,前一個屬第二章理論分布和抽樣分布

對于泊松分布,當(dāng)μ→∞時,泊松分布以正態(tài)分布為極限。在實際計算中,當(dāng)μ≥20(也有人認(rèn)為μ≥6)時,用泊松分布中的μ代替正態(tài)分布中的μ及σ2,即可由后者對前者進(jìn)行近似計算。89第二章理論分布和抽樣分布對于泊松分布,當(dāng)μ→∞時,泊2.3理論分布標(biāo)準(zhǔn)正態(tài)分布幾種特殊概率:P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545P(-3≤u<3)=0.9973P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99兩尾概率與一尾概率:兩尾概率:P(y<μ-kσ)+P(y>μ+kσ)=α一尾概率:P(y<μ-kσ)=P(y>μ+kσ)=α/2P(|u|≥2.58)=0.01P(|u|≥1.96)=0.05

902.3理論分布標(biāo)準(zhǔn)正態(tài)分布幾種特殊概率:902.3理論分布第六節(jié)樣本平均數(shù)的抽樣分布研究總體與從中抽取的樣本之間的關(guān)系是統(tǒng)計學(xué)的中心內(nèi)容。對這種關(guān)系的研究可從兩方面著手:?。簭目傮w到樣本,研究抽樣分布問題。即研究從總體中抽出的所有可能樣本統(tǒng)計量的分布及其與原總體的關(guān)系。本節(jié)討論。ⅱ:從樣本到總體,研究統(tǒng)計推斷問題。即從總體中隨機抽取樣本,并用樣本對總體作出推論。912.3理論分布第六節(jié)樣本平均數(shù)的抽樣分布912.3理論分布統(tǒng)計推斷是以總體分布和樣本抽樣分布的理論關(guān)系為基礎(chǔ)的。為了能正確地利用樣本去推斷總體,并能正確地理解統(tǒng)計推斷的結(jié)論,須對樣本的抽樣分布有所了解。我們知道,由總體中隨機地抽取若干個體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計量(如,S)也將隨樣本的不同而有所不同,因而樣本統(tǒng)計量也是隨機變量,也有其概率分布。我們把統(tǒng)計量的概率分布稱為抽樣分布。

922.3理論分布統(tǒng)計推斷是以總體分布和樣本抽樣分布的理論2.3理論分布由總體隨機抽樣(randomsampling)的方法可分為有返置抽樣和不返置抽樣兩種。前者指每次抽出一個個體后,這個個體應(yīng)返置回原總體;后者指每次抽出的個體不返置回原總體。對于無限總體,返置與否都可保證各個體被抽到的機會相等。對于有限總體,就應(yīng)該采取返置抽樣,否則各個體被抽到的機會就不相等。

932.3理論分布由總體隨機抽樣(randomsampl2.3理論分布一、樣本平均數(shù)抽樣分布設(shè)有一個總體,總體平均數(shù)為μ,方差為σ2,總體中各變數(shù)為y,將此總體稱為原總體?,F(xiàn)從這個總體中隨機抽取含量為n的樣本,樣本平均數(shù)記為。942.3理論分布一、樣本平均數(shù)抽樣分布942.3理論分布可以設(shè)想,從原總體中可抽出個含量為n的樣本。由這些樣本算得的平均數(shù)有大有小,不盡相同,與原總體平均數(shù)μ相比往往表現(xiàn)出不同程度的差異。這種差異是由隨機抽樣造成的,稱為抽樣誤差(samplingerror)。顯然,樣本平均數(shù)也是一個隨機變量,其概率分布叫做樣本平均數(shù)的抽樣分布。由樣本平均數(shù)構(gòu)成的總體稱為樣本平均數(shù)的抽樣總體。

952.3理論分布可以設(shè)想,從原總體中可抽出個含2.3理論分布

962.3理論分布962.3理論分布的總體平均數(shù)記為、總體方差記為,的抽樣總體標(biāo)準(zhǔn)差簡稱總體標(biāo)準(zhǔn)誤,表示平均數(shù)抽樣誤差的大小。數(shù)理統(tǒng)計的推導(dǎo)表明,樣本平均數(shù)構(gòu)成的總體與原Y總體參數(shù)間具有以下關(guān)系:

972.3理論分布的總體平均數(shù)記為、總2.3理論分布1.2.大小與起始總體成正比、而與樣本含量n平方根成反比。表明增大樣本含量n才能降低抽樣誤差。抽樣分布的標(biāo)準(zhǔn)差又稱為標(biāo)準(zhǔn)誤,它可以度量抽樣分布的變異。對于樣本平均數(shù)分布,有樣本標(biāo)準(zhǔn)誤():其中,即意義:因為S估計,故估計,即估計,表明樣本標(biāo)準(zhǔn)誤是平均數(shù)抽樣誤差的估計值。982.3理論分布1.2.3理論分布3.中心極限定理若,且y1、y2、…、yn

來自Y總體,則,且、、,即。若Y不服從正態(tài)分布,具有總體平均數(shù)μ、總體方差σ2,且y1、y2、…、yn來自Y總體,則n相當(dāng)大時,。992.3理論分布3.中心極限定理99第二章理論分布和抽樣分布

抽樣試驗:設(shè)有一個N=4的有限總體,變數(shù)為2、3、3、4。根據(jù)μ=Σy/N和σ2=Σ(y-μ)2/N求得該總體的μ、σ2、σ為:

μ=3,σ2=1/2,σ==0.707100第二章理論分布和抽樣分布抽樣試驗:100第二章理論分布和抽樣分布

從有限總體作返置隨機抽樣,所有可能的樣本數(shù)為Nn,其中n為樣本含量。以上述總體而論,如果從中抽取n=2的樣本,共可得42=16個樣本;如果樣本含量n為4,則一共可抽得44=256個樣本。分別求這些樣本的平均數(shù),其次數(shù)分布如表4—6所示。根據(jù)表4—6,在n=2的試驗中,樣本平均數(shù)抽樣總體的平均數(shù)、方差與標(biāo)準(zhǔn)差分別為:101第二章理論分布和抽樣分布從有限總體作返置隨機抽樣,所有第二章理論分布和抽樣分布

=4/16=1/4=(1/2)/2=102第二章理論分布和抽樣分布102第二章理論分布和抽樣分布

同理,可得n=4時:這就驗證了,的正確性。103第二章理論分布和抽樣分布同理,可得n=4時:103第二章理論分布和抽樣分布

表4—6N=4,n=2和n=4時的次數(shù)分布104第二章理論分布和抽樣分布表4—6N=4,n=2和2.3理論分布

1052.3理論分布105第二章理論分布和抽樣分布

由以上模擬抽樣試驗可以看出,雖然原總體并非正態(tài)分布,但從中隨機抽取樣本,即使樣本含量很小(n=2,n=4),樣本平均數(shù)的分布卻趨向于正態(tài)分布形式。隨著樣本含量n的增大,樣本平均數(shù)的分布愈來愈從不連續(xù)趨向于連續(xù)的正態(tài)分布。106第二章理論分布和抽樣分布由以上模擬抽樣試驗可以看出,第二章理論分布和抽樣分布

中心極限定理告訴我們:不論Y變量是連續(xù)型還是離散型,也無論Y服從何種分布,一般只要n>30,就可認(rèn)為的分布是正態(tài)的。107第二章理論分布和抽樣分布中心極限定理告訴我們:不論Y變第二章理論分布和抽樣分布

注意,樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個統(tǒng)計量。二者的區(qū)別在于:樣本標(biāo)準(zhǔn)差S是反映樣本中各觀測值,,…,變異程度大小的一個指標(biāo),它的大小說明了對該樣本代表性的強弱。樣本標(biāo)準(zhǔn)誤是樣本平均數(shù)的標(biāo)準(zhǔn)差,它是抽樣誤差的估計值,其大小說明了樣本間變異程度的大小及精確性的高低。108第二章理論分布和抽樣分布注意,樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是2.3理論分布樣本平均數(shù)分布可標(biāo)準(zhǔn)化,獲得u值。從u值可查正態(tài)離差概率表,獲得其相應(yīng)的概率。

1092.3理論分布樣本平均數(shù)分布可標(biāo)準(zhǔn)化,獲得u值。1092.3理論分布二、兩個獨立樣本平均數(shù)差數(shù)的抽樣分布如果從一個總體隨機地抽取一個樣本容量為的樣本,同時隨機獨立地從另一個總體抽取一個樣本容量為的樣本,那么可以得到分別屬于兩個總體的樣本,這兩個樣本的平均數(shù)用和表示。1102.3理論分布二、兩個獨立樣本平均數(shù)差數(shù)的抽樣分布112.3理論分布設(shè)這兩個樣本所來自的兩個總體的平均數(shù)分別為和,它們的方差分別為和。根據(jù)數(shù)理統(tǒng)計的推導(dǎo),兩個獨立隨機抽取的樣本平均數(shù)間差數(shù)()的抽樣分布參數(shù)與兩個母總體間存在如下關(guān)系:

1112.3理論分布設(shè)這兩個樣本所來自的兩個總體的平均數(shù)分別2.3理論分布(1)兩個樣本平均數(shù)差數(shù)分布的平均數(shù)必等于兩母總體平均數(shù)的差數(shù)。

(2)兩個獨立的樣本平均數(shù)差數(shù)分布的方差等于兩母總體的樣本平均數(shù)的方差總和。

其差數(shù)標(biāo)準(zhǔn)差為:1122.3理論分布(1)兩個樣本平均數(shù)差數(shù)分布的平均數(shù)2.3理論分布(3)如果兩個總體各作正態(tài)分布,則其樣本平均數(shù)差數(shù)()準(zhǔn)確地遵循正態(tài)分布律,無論樣本容量大或小,都有N()。若兩個樣本抽自于兩個非正態(tài)總體,尤其與相差很大時,則其平均數(shù)差數(shù)的抽樣分布很難確定。不過當(dāng)和相當(dāng)大、而與相差不太遠(yuǎn)時,也可近似地應(yīng)用正態(tài)接近方法估計平均數(shù)差數(shù)出現(xiàn)的概率,當(dāng)然這種估計的可靠性得依兩總體偏離正態(tài)的程度和相差大小而轉(zhuǎn)移。1132.3理論分布(3)如果兩個總體各作正態(tài)分布,則其樣2.3理論分布兩個獨立樣本平均數(shù)差數(shù)的分布也可標(biāo)準(zhǔn)化,獲得u值。從u值可查正態(tài)離差概率表,獲得其相應(yīng)的概率。

1142.3理論分布兩個獨立樣本平均數(shù)差數(shù)的分布也可標(biāo)準(zhǔn)化,2.3理論分布第五節(jié)

t

分布由樣本平均數(shù)抽樣分布的性質(zhì)知道:若Y~N(μ,σ2),則~N(μ,σ2/n)。將隨機變量標(biāo)準(zhǔn)化得:,則u~N(0,1)。當(dāng)總體標(biāo)準(zhǔn)差σ未知時,以樣本標(biāo)準(zhǔn)差S代替σ所得到的統(tǒng)計量記為t。在計算時,由于采用S來代替σ,使得t變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從t分布(t-distribution)。,具n-1的自由度。1152.3理論分布第五節(jié)t分布1152.3理論分布t分布的概率分布密度函數(shù)如下:式中,-∞<t<∞;df=n-1為t分布的自由度。當(dāng)df的增大,t分布趨向于標(biāo)準(zhǔn)正態(tài)分布。

t分布的平均數(shù)和標(biāo)準(zhǔn)差為:μt=0(df>1)

(df>2)

1162.3理論分布t分布的概率分布密度函數(shù)如下:1162.3理論分布t分布密度曲線如圖所示,其特點是:1172.3理論分布t分布密度曲線如圖所示,1172.3理論分布1、t分布受自由度的制約,每一個自由度都有一條t分布密度曲線。2、t分布密度曲線以縱軸為對稱軸,左右對稱,且在t=0時,分布密度函數(shù)取得最大值。3、與標(biāo)準(zhǔn)正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平。df越小這種趨勢越明顯。df越大,t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布。當(dāng):n>30時,t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很??;n>100時,t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;n→∞時,t分布與標(biāo)準(zhǔn)正態(tài)分布完全一致。1182.3理論分布1、t分布受自由度的制約,每一個自由度都2.3理論分布t分布的概率分布函數(shù)為:

因而t在區(qū)間(t1,+∞)取值的概率——右尾概率為1-Ft(df)。由于t分布左右對稱,t在區(qū)間(-∞,-t1)取值的概率也為1-Ft(df)。于是t分布曲線下由-∞到-t1和由t1到+∞兩個相等的概率之和——兩尾概率為2(1-Ft(df))。對于不同自由度下t分布的兩尾概率及其對應(yīng)的臨界t值已編制成附表4,即t分布表。1192.3理論分布t分布的概率分布函數(shù)為:1192.3理論分布例如,當(dāng)df=15時,查附表4得兩尾概率等于0.05的臨界t值為=2.131,其意義是:

P(-∞<t<-2.131)=P(2.131<t<+∞)=0.025;

P(-∞<t<-2.131)+p(2.131<t<+∞)=0.05。由附表4可知,當(dāng)df一定時,概率P越大,臨界t值越??;概率P越小,臨界t值越大。當(dāng)概率P一定時,隨著df的增加,臨界t值在減小,當(dāng)df=∞時,臨界t值與標(biāo)準(zhǔn)正態(tài)分布的臨界u值相等。

1202.3理論分布例如,當(dāng)df=15時,查附表4得兩尾概率第二章理論分布和抽樣分布如果將離散型隨機變量Y的一切可能取值y的概率P(Y=y)寫成y的函數(shù)稱為隨機變量Y的概率函數(shù):一、正態(tài)分布的定義及其特征如果從一個總體隨機地抽取一個樣本容量為的樣本,同時隨機獨立地從另一個總體抽取一個樣本容量為的樣本,那么可以得到分別屬于兩個總體的樣本,這兩個樣本的平均數(shù)用和表示。從有限總體作返置隨機抽樣,所有可能的樣本數(shù)為Nn,其中n為樣本含量。對上式作變換u=(y-μ)/σ,得dy=σdu,故有:=0.P(-∞<t<-2.例如,在編號為1、2、3、…、10的十頭豬中隨機抽取1頭,有10種不同的可能結(jié)果:“取得一個編號是1”、…,這10個事件都是不可能再分的事件。正態(tài)分布密度曲線和橫軸圍成的一個區(qū)域,其面積為1,這實際上表明了“隨機變量Y取值在-∞與+∞之間”是一個必然事件,其概率為1。=Φ(0.在統(tǒng)計學(xué)上,把小概率事件在一次試驗中看成是實際不可能發(fā)生的事件稱為小概率事件實際不可能性原理,亦稱為小概率原理。第六章方差分析

第六節(jié)

F分布

在一個平均數(shù)為μ、方差為的正態(tài)總體中,隨機抽取兩個獨立樣本,分別求得其均方和,將和的比值定義為F:

(6.8)即從一個總體內(nèi)隨機抽取的兩個樣本的方差和的比值稱為F值。此F值具有的自由度和的自由度。如果在給定的和下按上述方法從正態(tài)總體中進(jìn)行一系列抽樣,就可得到一系列的F值而作成一個F分布。

121第二章理論分布和抽樣分布第六章方差分析第六節(jié)F第六章方差分析

統(tǒng)計理論的研究證明,F(xiàn)分布乃具有平均數(shù)和取值區(qū)間為的一組曲線;而某一特定曲線的形狀則僅決定于參數(shù)和。在或=1時,F(xiàn)分布曲線是嚴(yán)重傾斜成反向J型;當(dāng)時,曲線轉(zhuǎn)為偏態(tài)(圖6.1)122第六章方差分析統(tǒng)計理論的研究證明,F(xiàn)分布乃具有平第六章方差分析

F分布下一定區(qū)間的概率可從已制成的統(tǒng)計表查出。附表7系各種和下右尾概率α=0.05和α=0.01時的臨界F值(一尾概率表)。123第六章方差分析F分布下一定區(qū)間的概率可從已制成的統(tǒng)計表第六章方差分析

附表7的數(shù)值設(shè)計是專供測驗的總體方差是否顯著大于的總體方差而設(shè)計的(對),F(xiàn)=。這種用F值出現(xiàn)概率的大小推斷兩個總體方差是否相等的測驗方法稱為F測驗。124第六章方差分析附表7的數(shù)值設(shè)計是專供測驗的總體方第六章方差分析

[例]算得均方=3.90,均方=0.78,具自由度=4,=20。試測驗差異顯著性?假設(shè),,α=0.05。測驗計算: F=3.90/0.78=5.00計算得F=5.00表示均方為均方的5倍。實得。推斷:否定,接受;即顯著地大于。125第六章方差分析[例]算得均方=3.90,=0.由這些樣本算得的平均數(shù)有大有小,不盡相同,與原總體平均數(shù)μ相比往往表現(xiàn)出不同程度的差異。例如,一粒種子可能發(fā)芽也可能不發(fā)芽、隨機抽出一只動物可能是雌性也可能是雄性等,這類變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論