




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
《統(tǒng)計(jì)學(xué)》第9章抽樣與抽樣估計(jì)第一頁,共57頁。第1節(jié)抽樣與抽樣分布
一、有關(guān)抽樣的基本概念
總體(Population)
研究對(duì)象的全體稱為總體樣本(子樣)(Sample)
從總體中抽取一部分個(gè)體進(jìn)行試驗(yàn)或觀察,這種從總體中抽取個(gè)體的行為稱為抽樣。而從總體中抽樣所得的一部分個(gè)體叫樣本總體參數(shù)(Populationparameter)
描述總體分布特征的數(shù)值樣本統(tǒng)計(jì)量(Samplestatistic)第二頁,共57頁。抽樣方法
重置抽樣(重復(fù)抽樣)(Samplingwithreplacement)
要從總體N個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每次從總體中抽取一個(gè)單位,把順序號(hào)登記下來之后,重新放回參加下一次抽選,連續(xù)反復(fù)抽取n次組成所要求容量的樣本。不重置抽樣(不重復(fù)抽樣)(Samplingwithoutreplacement)
要從總體N個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每次從總體中抽取一個(gè)單位,被抽中的單位不再放回參加下一次抽選,連續(xù)進(jìn)行次便組成樣本。不重復(fù)抽樣所得樣本對(duì)總體的代表性較大,抽樣誤差較小,所以實(shí)踐中通常采用不重復(fù)抽樣。
第三頁,共57頁。抽樣的組織方式簡單隨機(jī)抽樣:從總體中抽取樣本最常用的方法。從容量為N的總體中進(jìn)行抽樣,如果容量為n的每個(gè)可能樣本被抽到的可能性相等,則稱容量為n的樣本為簡單隨機(jī)樣本。分層抽樣:也稱分類抽樣或類型抽樣,它是按某個(gè)主要標(biāo)志對(duì)總體各單位進(jìn)行分類,然后從各層中按隨機(jī)原則分別抽取一定數(shù)目的單位構(gòu)成樣本。整群抽樣:也稱叢聚抽樣或集團(tuán)抽樣。它是將總體分為若干部分(每一部分稱為一個(gè)群),然后按隨機(jī)原則從中一群一群地抽選,對(duì)抽中群內(nèi)的所有單位進(jìn)行全面調(diào)查。系統(tǒng)抽樣也稱機(jī)械抽樣。它是先將總體單位按一定順序排隊(duì),計(jì)算出抽樣間隔(或抽樣距離),然后按固定的順序和間隔抽取樣本單位。第四頁,共57頁??傮w分布
(populationdistribution)第五頁,共57頁。樣本分布
(sampledistribution)一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本第六頁,共57頁。第七頁,共57頁。二、抽樣分布
(Samplingdistribution)
1、抽樣分布的意義
對(duì)統(tǒng)計(jì)量的所有可能取值及其對(duì)應(yīng)概率的描述,就是統(tǒng)計(jì)量的抽樣分布,即抽樣分布。抽樣分布反映樣本統(tǒng)計(jì)量的分布特征,根據(jù)抽樣分布的規(guī)律,可揭示樣本統(tǒng)計(jì)量與總體參數(shù)之間的關(guān)系,計(jì)算抽樣誤差,并說明抽樣推斷的可靠程度。
第八頁,共57頁。抽樣誤差:誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性誤差登記性誤差是指在調(diào)查和匯總過程中由于觀察、測量、登記、計(jì)算等方法的差錯(cuò)或被調(diào)查者提供虛假資料而造成的誤差。任何一種統(tǒng)計(jì)調(diào)查都可能產(chǎn)生登記性誤差。代表性誤差是指用樣本指標(biāo)推斷總體指標(biāo)時(shí),由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致、樣本不能完全代表總體而產(chǎn)生的誤差。系統(tǒng)性誤差是指由于非隨機(jī)因素引起的樣本代表性不足而產(chǎn)生的誤差,表現(xiàn)為樣本估計(jì)量的值系統(tǒng)偏低或偏高。。隨機(jī)性誤差又稱偶然性誤差,是指遵循隨機(jī)原則抽樣,由于隨機(jī)因素(偶然性因素)引起的誤差。抽樣估計(jì)中的所謂抽樣誤差,就是指的這種隨機(jī)誤差。第九頁,共57頁。抽樣誤差登記性誤差:存在于一切調(diào)查中代表性誤差:僅產(chǎn)生于抽樣調(diào)查,不可避免。代表性誤差抽樣誤差在實(shí)際一次調(diào)查中是調(diào)查不出來的,但其平均值是可以推算的系統(tǒng)性誤差:不隨樣本量增減而變化隨機(jī)誤差(抽樣誤差):隨樣本量增大而減小第十頁,共57頁。抽樣平均誤差和抽樣極限誤差抽樣平均誤差:所有可能的樣本指標(biāo)與總體指標(biāo)間的平均差異程度。第十一頁,共57頁。抽樣極限誤差樣本指標(biāo)與總體指標(biāo)之間允許的誤差范圍叫抽樣極限誤差。也稱抽樣允許誤差。它是樣本指標(biāo)可允許變動(dòng)的上限或下限與總體指標(biāo)之差的絕對(duì)值。即:第十二頁,共57頁。落在總體均值某一區(qū)間內(nèi)的樣本X95.45%的樣本99.73%的樣本x-368.27%的樣本x-2x-X+3X+2X+x第十三頁,共57頁。大數(shù)定律及中心極限定理重復(fù)抽樣:(1)總體是正態(tài)分布,樣本必然是正態(tài)分布(2)樣本平均數(shù)的平均數(shù)等于總體平均數(shù)(3)樣本平均數(shù)的方差等于總體方差除以樣本
容量n(4)n越大,樣本平均數(shù)越趨近于正態(tài)分布第十四頁,共57頁。例:樣本均值的抽樣分布
【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)
,即總體單位數(shù)N=4。4
個(gè)個(gè)體分別為X1=1、X2=2、X3=3
、X4=4
??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差第十五頁,共57頁?,F(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有4*4=16個(gè)樣本。所有樣本的結(jié)果為
3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))第十六頁,共57頁。計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布
3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5第十七頁,共57頁。樣本均值的分布與總體分布的比較=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X第十八頁,共57頁。大數(shù)定律及中心極限定理不重復(fù)抽樣:(1)總體是正態(tài)分布,樣本必然是正態(tài)分布(2)樣本平均數(shù)的平均數(shù)等于總體平均數(shù)(3)樣本平均數(shù)的方差等于總體方差除以樣本
容量n(4)n越大,樣本平均數(shù)越趨近于正態(tài)分布第十九頁,共57頁。抽樣平均誤差(1)均值重復(fù)抽樣:不重復(fù)抽樣:第二十頁,共57頁。抽樣平均誤差(1)比例重復(fù)抽樣:不重復(fù)抽樣:第二十一頁,共57頁。影響抽樣誤差大小的因素是:總體被研究標(biāo)志的變異程度。在其他條件不變的情況下,總體標(biāo)志的變異程度愈小,則抽樣誤差也愈??;總體標(biāo)志的變異程度愈大,則抽樣誤差也愈大。抽樣單位數(shù)的多少。在其他條件不變的情況下,抽樣單位數(shù)愈多,抽樣誤差愈小;抽樣單位數(shù)愈少,抽樣誤差愈大。抽樣的方法。在其他條件不變的情況下,重復(fù)抽樣的抽樣誤差大于不重復(fù)抽樣。抽樣的組織形式。抽樣誤差的大小與樣本單位數(shù)的平方根成反比:如果抽樣誤差要減少二分之一,則樣本單位數(shù)必須增大到4倍。第二十二頁,共57頁。例、從某校1000名學(xué)生中簡單隨機(jī)抽取50名學(xué)生,稱得平均體重為50千克,若已知總體標(biāo)準(zhǔn)差為10千克,計(jì)算重復(fù)抽樣及不重復(fù)抽樣下抽樣平均誤差。解:重復(fù)抽樣條件下,不重復(fù)抽樣條件下,
在樣本量相同的情況下,不重復(fù)抽樣的平均誤差要小于重復(fù)抽樣的平均誤差。第二十三頁,共57頁。第3節(jié)總體平均數(shù)和總體比例的估計(jì)抽樣估計(jì)必須包括三要素:1)估計(jì)值2)估計(jì)值的誤差范圍3)概率保證程度(置信度)第二十四頁,共57頁。一、點(diǎn)估計(jì)(Pointestimate)點(diǎn)估計(jì)也稱定值估計(jì),常用點(diǎn)估計(jì)方法有矩估計(jì),極大似然估計(jì)。樣本均值是總體均值的點(diǎn)估計(jì)量,樣本方差s2是總體方差σ2的點(diǎn)估計(jì)量,樣本比例p是總體比例P的點(diǎn)估計(jì)量。優(yōu)良估計(jì)量的標(biāo)準(zhǔn):無偏性有效性一致性第二十五頁,共57頁。區(qū)間估計(jì)就是根據(jù)樣本求出總體未知參數(shù)的估計(jì)區(qū)間,并使其可靠程度達(dá)到預(yù)定要求。(1)
總體方差σ2已知時(shí)由于,所以對(duì)于給定的置信度1-α,有即可見,極限誤差的計(jì)算公式為則總體均值的置信區(qū)間為第二十六頁,共57頁。例:從某大學(xué)學(xué)生中隨機(jī)抽取100名調(diào)查體重情況。經(jīng)稱量和計(jì)算,得到平均體重為58千克。根據(jù)過去的資料知道大學(xué)生體重的標(biāo)準(zhǔn)差是10千克。在95%的置信水平下,求該大學(xué)學(xué)生平均體重的置信區(qū)間。
解:已知=58,σ=10,zα/2=1.96,n=100=10/10=1(千克)
=1.96×1=1.96(千克)置信下限為58-1.96=57.04,置信上限為58+1.96=59.96故所求置信區(qū)間為(57.04,59.96)千克。第二十七頁,共57頁。
(2)
總體方差σ2未知時(shí)
由于~t(n-1),對(duì)于給定的置信度1-α,有置信下限置信上限在大樣本下,總體均值的置信區(qū)間為第二十八頁,共57頁。例:某保險(xiǎn)公司投保人年齡設(shè)某保險(xiǎn)公司投保人年齡呈正態(tài)分布,現(xiàn)從中抽取10人,其年齡分別為:32,50,40,24,33,44,45,48,44,47歲。試以95%的置信水平估計(jì)該保險(xiǎn)公司投保人的平均年齡。
解:當(dāng)置信度為95%時(shí),=2.26222.6544=6.00(歲)因?yàn)?0.7-6.00=34.740.7+6.00=46.7所以該保險(xiǎn)公司投保人的平均年齡的置信區(qū)間為(34.7,46.7)歲。
第二十九頁,共57頁??傮w比例的區(qū)間估計(jì)在大樣本條件下,若np>5,n(1-p)>5,則樣本比例趨近于正態(tài)分布。對(duì)于給定置信度,有總體比例的置信區(qū)間為小樣本條件下,不作介紹。第三十頁,共57頁。例:總體比例的區(qū)間估計(jì)
【例】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)抽取了100個(gè)下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%
第三十一頁,共57頁。例:某廠對(duì)一批產(chǎn)品進(jìn)行質(zhì)量檢驗(yàn),隨機(jī)重復(fù)抽取樣品100只,樣本合格品率為95%,試計(jì)算把握程度為90%的合格品率置信區(qū)間。
解:已知n=100,p=95%,1-α=90%,查表得zα/2=1.96
=0.0218
Δp=zα/2=1.96×0.0218=0.0359或3.59%
95%-3.59%=91.41%,95%+3.59%=98.59%
故該批產(chǎn)品合格率的置信區(qū)間為(91.41%,98.59%)第三十二頁,共57頁。第5節(jié)樣本容量的確定
在重復(fù)抽樣下,
所以,必要抽樣單位數(shù)在不重復(fù)抽樣下,必要抽樣單位數(shù)
第三十三頁,共57頁。例:某市進(jìn)行職工家庭生活費(fèi)抽樣調(diào)查,已知職工家庭平均每人每月生活費(fèi)收入的標(biāo)準(zhǔn)差為110元,允許誤差范圍10元,概率把握程度95%,試確定應(yīng)抽選的戶數(shù)。
解:第三十四頁,共57頁。【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計(jì)年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?
解:第三十五頁,共57頁。影響必要抽樣數(shù)目的因素(1)允許誤差范圍Δ。當(dāng)其它條件不變時(shí),允許誤差愈小,必要的抽樣單位數(shù)就需要愈多;反之,允許誤差愈大,抽樣單位數(shù)就可以愈少。(2)總體方差σ2。其他條件不變的情況下,總體方差σ2愈大,總體單位的差異程度愈大,則樣本單位數(shù)應(yīng)愈多;反之,樣本單位數(shù)可愈少。(3)抽樣估計(jì)的可靠程度1-α。當(dāng)其他條件不變時(shí),抽樣估計(jì)的可靠程度愈高,zα/2數(shù)值愈大,抽樣數(shù)目就必須愈多;反之,抽樣估計(jì)的可靠程度愈低,抽樣數(shù)目就可以愈少。(4)抽樣方法。相同條件下,由于采用重復(fù)抽樣比不重復(fù)抽樣的誤差大,所以,前者應(yīng)比后者多抽一些樣本單位。除上述因素之外,抽樣組織方式也是影響抽樣單位數(shù)的一個(gè)原因。第三十六頁,共57頁。本章小結(jié)總體分布、樣本分布、抽樣分布單總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的分布參數(shù)估計(jì)的一般問題一個(gè)總體參數(shù)的區(qū)間估計(jì)樣本容量的確定第三十七頁,共57頁。期末考試大綱第九章抽樣與抽樣估計(jì)抽樣調(diào)查中的基本概念;總體均值與成數(shù)的簡單估計(jì);必要樣本量的計(jì)算不作考試要求。第三十八頁,共57頁。知識(shí)重點(diǎn):抽樣方法重置抽樣不重置抽樣注意:不重復(fù)抽樣所得樣本對(duì)總體的代表性較大,抽樣誤差較小,所以實(shí)踐中通常采用不重復(fù)抽樣。第三十九頁,共57頁。抽樣的組織方式簡單隨機(jī)抽樣:分層抽樣:整群抽樣:系統(tǒng)抽樣也稱機(jī)械抽樣。第四十頁,共57頁。誤差:誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性誤差第四十一頁,共57頁。抽樣平均誤差(1)均值重復(fù)抽樣:不重復(fù)抽樣:第四十二頁,共57頁。抽樣平均誤差(2)比例重復(fù)抽樣:不重復(fù)抽樣:第四十三頁,共57頁。影響抽樣誤差大小的因素是:總體被研究標(biāo)志的變異程度。抽樣單位數(shù)的多少。抽樣的方法。
抽樣的組織形式。第四十四頁,共57頁。(1)
總體方差σ2已知時(shí)總體均值的置信區(qū)間為區(qū)間估計(jì)其中極限誤差為第四十五頁,共57頁。
(2)
總體方差σ2未知時(shí)
總體均值的置信區(qū)間為其中極限誤差為第四十六頁,共57頁??傮w比例的區(qū)間估計(jì)總體比例的置信區(qū)間為第四十七頁,共57頁。第5節(jié)樣本容量的確定
在重復(fù)抽樣下,
所以,必要抽樣單位數(shù)在不重復(fù)抽樣下,必要抽樣單位數(shù)
第四十八頁,共57頁。影響必要抽樣數(shù)目的因素(1)允許誤差范圍Δ。當(dāng)其它條件不變時(shí),允許誤差愈小,必要的抽樣單位數(shù)就需要愈多;反之,允許誤差愈大,抽樣單位數(shù)就可以愈少。(2)總體方差σ2。其他條件不變的情況下,總體方差σ2愈大,總體單位的差異程度愈大,則樣本單位數(shù)應(yīng)愈多;反之,樣本單位數(shù)可愈少。(3)抽樣估計(jì)的可靠程度1-α。當(dāng)其他條件不變時(shí),抽樣估計(jì)的可靠程度愈高,zα/2數(shù)值愈大,抽樣數(shù)目就必須愈多;反之,抽樣估計(jì)的可靠程度愈低,抽樣數(shù)目就可以愈少。(4)抽樣方法。相同條件下,由于采用重復(fù)抽樣比不重復(fù)抽樣的誤差大,所以,前者應(yīng)比后者多抽一些樣本單位。除上述因素之外,抽樣組織方式也是影響抽樣單位數(shù)的一個(gè)原因。第四十九頁,共57頁。練習(xí):某電子元件廠生產(chǎn)A型號(hào)的電子管,現(xiàn)從10000件產(chǎn)品中,抽取100件進(jìn)行檢驗(yàn),結(jié)果是60件合格。計(jì)算合格品率的抽樣平均誤差。第五十頁,共57頁。練習(xí):對(duì)一批電子元件進(jìn)行耐用性能的檢查,隨機(jī)重置抽樣方法選取100件作耐用測試,所得結(jié)果的分組資料如下:耐用時(shí)數(shù)(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年礦用提升設(shè)備項(xiàng)目建議書
- 2025年健康產(chǎn)業(yè)行業(yè)研究報(bào)告及未來發(fā)展趨勢預(yù)測
- 2025年生活垃圾處理行業(yè)研究報(bào)告及未來發(fā)展趨勢預(yù)測
- 2025年油田化學(xué)品行業(yè)研究報(bào)告及未來發(fā)展趨勢預(yù)測
- 2025年男士襯衫行業(yè)研究報(bào)告及未來發(fā)展趨勢預(yù)測
- 一年級(jí)數(shù)學(xué)計(jì)算題專項(xiàng)練習(xí)1000題集錦
- 2025年激光焊接行業(yè)研究報(bào)告及未來發(fā)展趨勢預(yù)測
- 2025年超聲外科手術(shù)儀項(xiàng)目建議書
- 2025年資產(chǎn)管理行業(yè)研究報(bào)告及未來發(fā)展趨勢預(yù)測
- 甘南地區(qū)云杉林木良種選育幾種關(guān)鍵方法及其實(shí)踐性應(yīng)用的建議
- 2024年安徽省《輔警招聘考試必刷500題》考試題庫及完整答案(必背)
- 2024年全球及中國油藏模擬軟件行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報(bào)告
- 門式滿堂腳手架施工方案
- 異常產(chǎn)程的識(shí)別和處理課件
- 2025年度國際建筑安裝工程合同規(guī)范樣本
- 《宋代社會(huì)生活》課件
- 卒中綠道接診流程
- 《礦山機(jī)電安全管理》課件
- 2025年浙江嘉興海寧水務(wù)集團(tuán)招聘筆試參考題庫含答案解析
- 室分分布系統(tǒng)原理及方案
- 2025年供應(yīng)鏈管理培訓(xùn)課件:打造現(xiàn)代供應(yīng)鏈體系
評(píng)論
0/150
提交評(píng)論