社會調(diào)查研究抽樣課件_第1頁
社會調(diào)查研究抽樣課件_第2頁
社會調(diào)查研究抽樣課件_第3頁
社會調(diào)查研究抽樣課件_第4頁
社會調(diào)查研究抽樣課件_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1第六章抽樣2023/7/142一、抽樣的概念與作用二、概率抽樣的原理與程序三、概率抽樣方法四、非概率抽樣方法五、樣本規(guī)模與抽樣誤差2023/7/143一、抽樣的概念與作用1、抽樣的概念(1)個體:又稱分析單位,是一項調(diào)查中所要研究的對象,是收集信息的基本單位。(2)總體:是構(gòu)成它的所有個體的集合。用N表示。區(qū)分研究總體與調(diào)查總體(3)樣本:是從總體中按一定方式抽取的一部分個體的集合。用n表示。2023/7/144(4)抽樣:從總體中按一定方式選取樣本的過程。(5)抽樣單位:一次直接的抽樣所使用的基本單位。(6)抽樣框:又稱抽樣范圍,一次直接抽樣時總體中所有抽樣單位的名單。2023/7/145(7)參數(shù)值(8)統(tǒng)計值是關(guān)于總體中某一變量的綜合描述是關(guān)于樣本中某一變量的綜合描述用希臘字母表示用羅馬字母表示理論值經(jīng)驗值不變的可變的未知的已知的2023/7/146(9)抽樣誤差:在用樣本統(tǒng)計值去推論總體參數(shù)值時總會存在著偏差即抽樣誤差。(10)置信水平與置信區(qū)間:置信水平也叫置信度,是總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間內(nèi)的概率。這一區(qū)間稱為置信區(qū)間。2023/7/1472、抽樣的作用總體抽取樣本樣本推斷總體2023/7/1481984年美國總統(tǒng)選舉預(yù)測與實際結(jié)果比較里根蒙代爾《時代》64%36%《今日美國》63%37%《紐約時代周刊》61%39%《新聞周刊》59%41%《華盛頓郵報》57%43%哈里斯民意測驗56%44%羅珀民意測驗55%45%實際投票結(jié)果59%41%2023/7/1493、抽樣的類型概率抽樣:它是依據(jù)概率論的基本原理,按照等概率的原則進行的抽樣。它能避免抽樣過程的人為誤差,較好的保證樣本的代表性。非概率抽樣:它是依據(jù)研究者的主觀意愿或方便與否等因素來抽樣。它不考慮抽樣中的等概率原則,往往產(chǎn)生較大的誤差,樣本的代表性較差。2023/7/1410抽樣方法概率抽樣簡單隨機抽樣系統(tǒng)抽樣分層抽樣整群抽樣多段抽樣非概率抽樣偶遇抽樣判斷抽樣定額抽樣雪球抽樣2023/7/1411二、概率抽樣的原理與程序1、抽樣的基本原理同質(zhì)性和異質(zhì)性。隨機抽取放回抽樣與不放回抽樣。2023/7/14122、抽樣分布213是總體中各元素的觀測值所形成的相對頻次分布(百分比分布);分布通常是未知的;可以假定它服從某種分布。總體分布

總體2023/7/1414從總體中抽出一個容量為n的樣本,由這n個觀測值所形成的相對頻次分布;也稱經(jīng)驗分布;當樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布。樣本分布

樣本2023/7/1415在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻次分布;是一種理論分布;隨機變量是樣本統(tǒng)計量;樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本;是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)。 抽樣分布2023/7/1416抽樣分布的形成過程

總體計算樣本統(tǒng)計量如:樣本均值、比例、方差樣本2023/7/1417以樣本均值的抽樣分布為例218樣本均值的抽樣分布

【例】設(shè)一個總體,含有4個個體,即總體單位數(shù)N=4。4個個體分別為x1=1,x2=2,x3=3,x4=4

??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差2023/7/1419樣本均值的抽樣分布

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)2023/7/1420樣本均值的抽樣分布計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.52023/7/1421x的分布趨于正態(tài)分布的過程2023/7/14223、抽樣的程序(1)界定總體(2)制定抽樣框(3)決定抽樣方案(4)實際抽取樣本(5)評估樣本質(zhì)量2023/7/1423三、概率抽樣1、簡單隨機抽樣又稱純隨機抽樣,是對總體中所有個體按完全符合隨機原則的方法抽取樣本,即抽樣時不進行任何分組、排列,使總體中的所有個體都同樣有被抽中的機會。2023/7/1424隨機數(shù)字表是由計算機生成的由0-9組成的表。較大的隨機數(shù)字表有美國蘭德公司1955年編制出版的100萬數(shù)字的表和肯德爾與史密斯1938年編制出版的10萬數(shù)字表。2023/7/1425例:某單位有528人,欲隨機抽取10人調(diào)查

1、確定抽樣框,并將總體中所有個體按順序編號。2、根據(jù)總體規(guī)模的位數(shù)來確定從隨機數(shù)字表中選取幾位數(shù)碼。3、以總體規(guī)模為標準,對隨機數(shù)字表中的數(shù)碼逐一衡量取舍。4、根據(jù)樣本規(guī)模的要求選出足夠的數(shù)碼個數(shù)。5、根據(jù)隨機數(shù)字表中選中的數(shù)碼,到抽樣框中找相對應(yīng)的個體。00-0405-0910-1415-1900010203040506070809105446315389859416114905219414172835717783409508299596754226628520540756694408161999326940700001584820641571767665905188508241411286106518771920652108062988166164556592023/7/1426簡單隨機抽樣的特點:A.當總體中所含個體數(shù)目太多時,費時、工作繁雜、費用高。B.在構(gòu)成總體的個體差異不大時比較有效,總體異質(zhì)性高時誤差較大。2023/7/14272、系統(tǒng)抽樣又稱等距抽樣或機械抽樣。它是把總體中的個體編號排序后,再計算出某種間隔,按照這個固定間隔抽取個體的號碼來組成樣本的方法。2023/7/1428操作步驟:A、將總體中的每個個體編號排列,制定抽樣框。B、計算抽樣距離。K=N/nC、在最前面k個個體中采用簡單隨機抽樣法抽取一個樣本(編號為A)作為等距抽樣隨機的起點。D、自A開始,每隔K個個體抽取一個個體,編號分別為A,A+K,A+2K,A+3K,…,A+(n-1)K。E、將這n個個體合起來即為該總體的樣本。2023/7/1429例:設(shè)某大學(xué)有12000名學(xué)生,決定采用等距抽樣法從中抽取200名學(xué)生。A、計算K=12000/200=60B、用簡單隨機抽樣法在前60個學(xué)生中抽取第一個學(xué)生,設(shè)其序號為12。C、樣本為第12、72、132…號學(xué)生。若第199個學(xué)生的號碼是11952,第200個號碼為13。2023/7/1430等距抽樣的特點:易于實施,工作量少。樣本在總體中分布更均勻,抽樣誤差小于或等于簡單隨機抽樣。等距抽樣的前提:總體隨機排列。2023/7/14313、分層抽樣又稱類型抽樣,它是先將總體中的所有個體按照某種特征或標志劃分成若干類型或?qū)哟?,然后在各個類型或?qū)哟沃胁捎煤唵坞S機抽樣或等距抽樣法抽取一個子樣本,最后將這些子樣本合起來就是總體的樣本。

2023/7/1432分層抽樣的特點點:(1)當一個總體內(nèi)部分層明顯時,能克服簡單隨機抽樣和等距抽樣的缺點。(2)在不增加樣本規(guī)模的前提下降低抽樣誤差,提高抽樣精度。(3)有些研究不僅要了解總體的情況,還要了解某些類別的情況。2023/7/1433分層的標準以要分析和研究的主要變量或相關(guān)變量作為分層標準。以保證各層內(nèi)部同質(zhì)性性強、層間異質(zhì)性強為原則。以那些有明顯層次區(qū)分的變量作為分層變量。2023/7/1434

4、整群抽樣

又稱聚類抽樣,是將總體按照某種標準劃分為一些子群,每個子群作為一個抽樣單位,用隨機的辦法從中抽取若干子群,將抽出的子群的所有個體合起來就是總體的樣本。

2023/7/1435整群抽樣與分層抽樣的區(qū)別樣本抽取方法不同。子群劃分的原則不同。整群:群間同質(zhì)性高,群內(nèi)異質(zhì)性高。分層:層間異質(zhì)性高,層內(nèi)同質(zhì)性高。適用總體不同。整群:適用于界定不清的總體。分層:適用于界定分明的總體。2023/7/1436整群抽樣的特點:(1)可以通過變換抽樣單位擴大抽樣范圍。(2)節(jié)約成本。(3)樣本分布不均勻,代表性較差。2023/7/1437總體

5、多段抽樣:又稱多級抽樣,是按抽樣單位的隸屬關(guān)系,把抽樣過程分為幾個階段進行。

2023/7/1438優(yōu)點:節(jié)約成本,適用于范圍大、單位多、結(jié)構(gòu)復(fù)雜的調(diào)查對象。缺點:誤差大。減小多階段抽樣誤差的方法:相對增加開頭階段的樣本數(shù)而適當減少最后階段的樣本數(shù)。2023/7/14396、pps抽樣100000戶居民,分屬200個居委會。從中抽取1000戶居民。方案:從200個居委會中隨機抽取20個居委會;在被抽中的20個居委會中,每個居委會隨機抽取50戶居民。思考:若甲居委會有800戶居民,乙居委會有200戶居民。兩個居委會的居民被抽中的概率相等嗎?甲居委會居民被抽中的概率:20/200×50/800=1/160乙居委會居民被抽中的概率:20/200×50/200=1/40P(乙)=4P(甲)2023/7/1440PPS抽樣:叫做“概率與元素的規(guī)模大小成比例的抽樣”(samplingwithprobabilityproportionaltosize),適用于總體中元素大小不同,或元素在總體中的地位不同時。它是以階段性的(或暫時的)不等概率換取最終的、總體的等概率。2023/7/1441從10個學(xué)校共20000人的總體中,抽取一個容量為800的樣本。要求抽取8個學(xué)校,每個學(xué)校100人。(K=2500)學(xué)校人數(shù)累計人數(shù)編號

A100010001-1000B150025001001-2500C200045002501-4500D400085004501-8500E2000105008501-10500F30001350010501-13500G15001500013501-15000H15001650015001-16500I5001700016501-17000J30002000017001-200002023/7/1442PPS抽樣的實質(zhì):第一個階段,大的群被抽中的概率大,而小的群被抽中的概率?。坏诙€階段,被抽中的大的群中的元素被抽中的概率顯然小于被抽中的小的群中的元素。這一大一小,平衡了由于群的規(guī)模的不同帶來的概率差異。2023/7/1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論