




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十抽樣設(shè)計(jì)第1頁,共70頁。一、相關(guān)基本概念(一)、總體(或全域)總體是統(tǒng)計(jì)研究對(duì)象的全體,它有許多元素(總體單位)構(gòu)成,特點(diǎn)是:各個(gè)總體單位都有某種相同的特征把他們聯(lián)系在一起,同時(shí)各個(gè)個(gè)體的某個(gè)特征之間又存在差異,這種統(tǒng)一和差異就構(gòu)成了總體分布。抽樣調(diào)查的目的往往是對(duì)總體分布的一些特征作出估計(jì),因此抽樣調(diào)查中首先遇到的是確定總體的問題。第2頁,共70頁。
1、
全及總體:目標(biāo)總體。
所需研究的全部單位的集合體無論認(rèn)識(shí)與否,所有符合規(guī)定屬性或數(shù)量特征的單位合在一起就構(gòu)成了一個(gè)全及總體。它是抽樣調(diào)查推斷的目標(biāo)包括u有限總體與無限總體第3頁,共70頁。
2、作業(yè)總體N:抽樣總體即已被掌握和了解的,能按某一標(biāo)志排列或已經(jīng)編號(hào)的總體單位的集合,是抽取樣本的來源和依據(jù)。
第4頁,共70頁。顯然它是有限總體,它在范圍上比全及總體受到較多的限制。可以等于,但一般小于全及總體。
由于樣本來自于作業(yè)總體,因此結(jié)論也只適用于作業(yè)總體,因此要求作業(yè)總體盡可能接近全及總體。第5頁,共70頁。
3、變量總體:總體單位的標(biāo)志的性質(zhì)為數(shù)量,如身高、收入、銷售額、需求量等。屬性總體:研究標(biāo)志為品質(zhì)、類別等屬性,如質(zhì)量、等。第6頁,共70頁。同一總體,既可以是變量總體,也可以是屬性總體,取決于研究標(biāo)志的屬性,有時(shí)兩者都研究,兩者都是。如企業(yè)總體,研究標(biāo)志是職工人數(shù)、產(chǎn)值、稅、利等,為變量總體。研究標(biāo)志為所有制形式,就是屬性總體。第7頁,共70頁。(二)、抽樣與普查普查這一概念用于描述獲取同質(zhì)總體中每個(gè)成員的信息。抽樣指一個(gè)相對(duì)較小、但精心選擇的樣本能準(zhǔn)確地反映出所抽簽的總體的特征。一個(gè)樣本是總體所有成員的一個(gè)子集。從總體中子集獲得的有關(guān)信息,可以用來估測(cè)總體的特征。理想的狀況是,子集能夠代表總體的各個(gè)部分。第8頁,共70頁。(三)、樣本:X從作業(yè)總體中抽取出來進(jìn)行觀察的一部分總體單位的集合。又稱為子集。樣本容量:n
抽樣比:n/N
第9頁,共70頁。樣本與總體的關(guān)系:
全及總體是唯一的,但樣本不是
作業(yè)總體不一定是唯一的,作業(yè)總體小于全及總體時(shí)就不是唯一的。
樣本是總體的縮影與代表,抽樣調(diào)查的目的就是以對(duì)樣本的觀察結(jié)果來推斷總體的特征分布。第10頁,共70頁。樣本不是唯一的。不同的抽樣方法產(chǎn)生不同的樣本,同樣的抽樣方法每次獲得的樣本也不一定是相同的,如概率抽樣。
如果說總體是要研究推斷的對(duì)象,樣本就是要觀察的對(duì)象。第11頁,共70頁。(四)、總體指標(biāo)與樣本指標(biāo)總體指標(biāo):根據(jù)總體單位標(biāo)志值計(jì)算出的,唯一的。樣本指標(biāo):根據(jù)樣本計(jì)算出的,用于估計(jì)總體的。常用指標(biāo):平均數(shù)、期望、成數(shù)(比例)方差第12頁,共70頁。(五)調(diào)查單位與抽樣單位調(diào)查單位:總體單位,家庭、個(gè)人、企業(yè)、與抽樣單位:便于抽樣的中介單位
兩者可以相同,也可不同。有時(shí)一個(gè)抽樣單位包含多個(gè)調(diào)查單位,如以家庭為抽樣單位,以個(gè)人為調(diào)查單位;有時(shí)一個(gè)調(diào)查單位又包括多個(gè)抽樣單位。
第13頁,共70頁。單位可以自然形成,如個(gè)人、家庭、村莊、城鎮(zhèn),也可以人為劃分。如居委會(huì)、班級(jí)等。單位之間不能重合交叉、且完備能形成總體。
第14頁,共70頁。(六)抽樣框:編制抽樣單位的目錄
其范圍與作業(yè)總體一致。但單位是抽樣單位,有時(shí)與作業(yè)總體在形式上是有區(qū)別的。如:作業(yè)總體:全體在校生,以學(xué)號(hào)排列。抽樣框:學(xué)生宿舍隊(duì)列。
第15頁,共70頁。抽樣框幾種形式:名單抽樣框區(qū)域抽樣框(地圖)時(shí)間表抽樣框第16頁,共70頁。二、抽樣調(diào)查有關(guān)特征1、特點(diǎn)經(jīng)濟(jì)性效率高,時(shí)效性強(qiáng)準(zhǔn)確性(在可接受誤差范圍內(nèi)):如:總體指標(biāo)均值=80,樣本指標(biāo):80+-0.5第17頁,共70頁。2、抽樣調(diào)查適用情況無限總體
范圍過大、分布過散的有限總體:水庫中魚苗數(shù)量、森林木材儲(chǔ)量。
動(dòng)態(tài)總體:連續(xù)生產(chǎn)的產(chǎn)品性能,物價(jià)監(jiān)測(cè)、河流污染第18頁,共70頁。不適于全面調(diào)查又必須了解總體特征的事物。如產(chǎn)品壽命、汽車性能、血液檢驗(yàn)不必全面調(diào)查的總體:居民收支、兒童身高、體重、等,有其內(nèi)在相似性和規(guī)律性。時(shí)效性強(qiáng)的總體第19頁,共70頁。用于對(duì)總體特征的某種假設(shè)進(jìn)行檢驗(yàn),判斷真?zhèn)危瑸闆Q策提供依據(jù),如某項(xiàng)新工藝是否值得推廣。
第20頁,共70頁。3、關(guān)于抽樣調(diào)查的準(zhǔn)確性
人們對(duì)事物特征認(rèn)識(shí)準(zhǔn)確性的要求是相對(duì)的:載人航天、一般性的設(shè)備加工精度。
精度與費(fèi)用直接相關(guān),卻又不是線性相關(guān),也有一個(gè)邊際效用遞減,假設(shè)100%精度對(duì)應(yīng)100%費(fèi)用,20%費(fèi)用即可達(dá)到50%的精度,50%的費(fèi)用即可達(dá)到98%的精度。第21頁,共70頁。第22頁,共70頁。三、抽樣原理和抽樣設(shè)計(jì)研究的主要問題(一)、抽樣原理1、抽樣科學(xué)性基于理由:部分來自于總體,帶有反映全體的信息。構(gòu)成總體的個(gè)體之間在性質(zhì)上必定有相似或相近。不管原始分布如何,樣本特征的分布總可視為正態(tài)分布,而且由此得到總體參數(shù)的概率極大。第23頁,共70頁。如以一個(gè)總體分布已知的例子說明:N=6,原始分布為均勻分布,如下表,試通過容量為2的樣本估計(jì)總體的均值。
第24頁,共70頁。第25頁,共70頁。第26頁,共70頁。同時(shí):均值分布于3~4之間的概率是(5+6+5)/36=16/36=4/9均值位于2.5~4.5之間的概率是(4+5+6+5+4)/36=24/36=6/9如果增加樣本容量為3,精度就更高。第27頁,共70頁。(二)、抽樣設(shè)計(jì)主要問題樣本是用來代表并以此推斷總體的,故而樣本的代表性就是抽樣設(shè)計(jì)的主要問題,需要多少容量、如何抽樣、分布如何、誤差大小,都關(guān)系到樣本的代表性。如前文中樣本數(shù)量為3可以提高精度,不放回抽樣也可提高精度。又如估計(jì)全班的成績(jī)均值,概率抽樣、等距抽樣、非概率抽樣都可以,容量大小也可以,但精度不同。第28頁,共70頁。同時(shí)不同的抽樣方法和樣本容量對(duì)應(yīng)著不同的成本費(fèi)用。因此,抽樣設(shè)計(jì)就是要在保證樣本的充分代表性前提下,力求取得最經(jīng)濟(jì)最有效的效果。往往在預(yù)算一定情況下,抽樣設(shè)計(jì)須在精度與與預(yù)算之間求得平衡?;蛘咴诩榷ň纫笙铝η蠼?jīng)濟(jì)性。另外,抽樣設(shè)計(jì)須與甄別問卷、數(shù)據(jù)處理相適應(yīng)。還要取得委托方的認(rèn)可。第29頁,共70頁。四、制定抽樣計(jì)劃的步驟1.定義同質(zhì)總體詳細(xì)說明可提供信息或與所需信息有關(guān)的個(gè)體或?qū)嶓w所具有的特性??蓮囊韵聨追矫孢M(jìn)行描述:地域特征、人口統(tǒng)計(jì)學(xué)的特征、產(chǎn)品或服務(wù)使用情況、認(rèn)知程度等。第30頁,共70頁。2、選擇資料收集方法3、選擇抽樣框抽樣框是指總體的數(shù)據(jù)目錄或單位的名單,從中可以抽出樣本單位。理想的完整和準(zhǔn)確的名單通常是不存在的,因而需要依據(jù)能夠產(chǎn)生具有希望特征的樣本個(gè)體的程序來反映抽樣框。第31頁,共70頁。4、選擇抽樣方法取決于研究目的、經(jīng)濟(jì)實(shí)力、時(shí)間限制、欲調(diào)查問題的性質(zhì)。第32頁,共70頁。1)概率抽樣概率抽樣指在總體中的每個(gè)單位都具有同等可能性被抽中。概率抽樣的優(yōu)點(diǎn):信息全面、能估算出抽樣誤差、調(diào)查結(jié)果可以用來推斷總體。概率抽樣的弊病:費(fèi)用高、策劃和實(shí)施時(shí)間長(zhǎng)。第33頁,共70頁。2)非概率抽樣非概率抽樣指從總體中非隨機(jī)地選擇特定的要素(單位)。非概率抽樣的弊病:不能估計(jì)出抽樣誤差、難以確定樣本代表性的程度、難以推及總體。非概率抽樣的固有優(yōu)勢(shì):費(fèi)用低、實(shí)施時(shí)間少、若合理運(yùn)用也能產(chǎn)生極具代表性的合理的抽樣結(jié)果。第34頁,共70頁。5、確定樣本量考慮可得預(yù)算的重要性、各種各樣的抽選規(guī)則、子集量的分析和傳統(tǒng)的統(tǒng)計(jì)樣本量的計(jì)算。第35頁,共70頁。對(duì)非概率抽樣,通常依靠可得預(yù)算、抽選規(guī)則(憑經(jīng)驗(yàn)確定)、子集量分析來決定樣本量。對(duì)概率抽樣,需要在允許誤差的目標(biāo)水平和置信水平)下,計(jì)算樣本量。第36頁,共70頁。確定樣本量通??紤]這樣一些因素:A個(gè)體差異大小:大則多些B調(diào)查項(xiàng)目多少:多則多些C控制質(zhì)量情況:差則多些D抽樣組織方式:不嚴(yán)密則多些第37頁,共70頁。
6、制定選擇樣本單位的操作程序示例:抽樣的操作程序可以如下:以下指南是有關(guān)你在某個(gè)街區(qū)訪問時(shí)應(yīng)走的路徑。在城市中,這可能是一個(gè)城市街區(qū);在農(nóng)村,街區(qū)可能是一塊被道路包圍的土地。第38頁,共70頁。1)、如果在你的路線當(dāng)中遇到死胡同,繼續(xù)沿這條路或街道的另一面向反方向走。在可能的地方又拐,每隔兩戶住家訪問一戶。2)、如果你沿街區(qū)走了一圈,又回到了出發(fā)點(diǎn)而沒有完成列出的電話簿上家庭的四個(gè)訪問,那么可以試著訪問起點(diǎn)的那一家。第39頁,共70頁。3)、如果你調(diào)查了整個(gè)街區(qū),還是沒有完成所要求的訪問,則繼續(xù)從街區(qū)(或鄉(xiāng)間小路)對(duì)面附近的第一個(gè)住戶開始。只要這個(gè)地址在你的紙上的一個(gè)“*”旁出現(xiàn)就把它當(dāng)作你所在區(qū)域的接到中的另一個(gè)地址,并訪問這一家。如果不是,就訪問左邊的一家。永遠(yuǎn)遵守右手法則……第40頁,共70頁。7、描樣計(jì)劃的實(shí)施之前,應(yīng)先對(duì)抽樣進(jìn)行討論研究,檢查、確定是否要根據(jù)擬好的詳細(xì)程序來實(shí)施計(jì)劃。第41頁,共70頁。五、概率抽樣方法簡(jiǎn)單隨機(jī)抽樣系統(tǒng)抽樣(等距抽樣)分層抽樣整群抽樣第42頁,共70頁。1、簡(jiǎn)單隨機(jī)抽樣總體中每個(gè)單位在抽選時(shí)有相等的被抽中機(jī)會(huì)抽樣概率公式為:抽樣概率=樣本單位數(shù)/總體單位數(shù)
例如,如果總體單位數(shù)為10000,樣本單位數(shù)為400,那么抽樣概率為4%,計(jì)算過程為:0.04=400/10000第43頁,共70頁。如果一個(gè)抽樣框是可以得到的,簡(jiǎn)單隨機(jī)抽樣方式步驟如下:(1)對(duì)總體的每個(gè)單位進(jìn)行編號(hào),總體單位數(shù)為10000的總體可編號(hào)為1~10000。(2)在隨機(jī)數(shù)表中從任意的一個(gè)編號(hào)數(shù)開始向上數(shù)或向下數(shù)或跳躍數(shù)選編號(hào),在00001和10000之間選出400個(gè)(樣本單位數(shù))。(3)在有明確總體單位的數(shù)字表中選出的數(shù)字將包括在樣本中。第44頁,共70頁。優(yōu)點(diǎn):簡(jiǎn)單,并且滿足概率抽樣的一切必要的要求。缺點(diǎn):編制完整的表極其困難??赏ㄟ^電話隨機(jī)撥號(hào)功能完成這個(gè)步驟。亦可從電腦檔案中挑選調(diào)查對(duì)象。第45頁,共70頁。2、等距抽樣按隨機(jī)方法決定第一個(gè)樣本,之后按等距抽取其余(n-1)個(gè)樣本。在不失等概的原則下,將大大簡(jiǎn)化抽樣工作。第46頁,共70頁。
實(shí)施1)
編號(hào)1~N(抽樣框)2)
確定樣本容量n,計(jì)算間隔k= N/n3)
隨機(jī)確定起點(diǎn)r:1<r<k4)
等距抽取其余(n-1)個(gè)樣本:n1=r+0k,n2=r+1k,n3=r+2k……..第47頁,共70頁。優(yōu)缺點(diǎn)1簡(jiǎn)便、高效、成本低2標(biāo)志排隊(duì)復(fù)雜3效率和樣本代表性取決于排隊(duì)使用的標(biāo)志。若與所研究特征無關(guān),較易,如按電話本;這時(shí)代表性與簡(jiǎn)單抽樣結(jié)果差別不大,只是在獲取樣本手段上有區(qū)別。若相關(guān),則復(fù)雜,如按資金額、銷售量等排序;但這時(shí)樣本代表性增強(qiáng),可以覆蓋大中小各類樣本。第48頁,共70頁。
4、如果排序呈現(xiàn)周期性規(guī)律,樣本代表性難以保證。
5、誤差計(jì)算較復(fù)雜。第49頁,共70頁。3、分層抽樣1、含義:類型抽樣,先將總體單位按照某些重要標(biāo)志分類(分層),然后在各層(各類)中按照簡(jiǎn)單抽樣或等距抽樣抽取樣本單位的方法。第50頁,共70頁。2、分層指標(biāo)的選擇:標(biāo)準(zhǔn):分層后層內(nèi)差異最小,層間差異最大選擇:同質(zhì)性:層內(nèi)盡量同質(zhì)異質(zhì)性:層間異質(zhì)相關(guān)性:與所感興趣的特性密切相關(guān)費(fèi)用:易于測(cè)量和應(yīng)用,以減少分層費(fèi)用第51頁,共70頁。常用指標(biāo):人口統(tǒng)計(jì)特征:性別、年齡、種族、文化程度生活方式:媒介接觸行為、運(yùn)動(dòng)偏好、娛樂類型等消費(fèi)者類型單位規(guī)模行業(yè)類型:第52頁,共70頁。精度:分層指標(biāo)的選擇與精度直接相關(guān),保障層內(nèi)差異?。ǔ闃樱?,層間差異大(普查,各層都抽)。分層數(shù)要適當(dāng),過度會(huì)使精度的增益由于風(fēng)層費(fèi)用的增加和抽樣難度增加而被抵消。
第53頁,共70頁。3、抽樣方式比例分層:
等比例分層:各層樣本數(shù)量比例與各層總體單位數(shù)量比例一致。ni/n=Ni/N
不等比例分層:比如當(dāng)某層標(biāo)準(zhǔn)差較大時(shí),可以多抽樣。當(dāng)某層規(guī)模大而差異小、均勻時(shí),可以少抽。
第54頁,共70頁。最優(yōu)分層:ni=n×(NiSi/∑NiSi)式中:ni:各層應(yīng)抽取的樣本量
n:樣本總量
Ni:各層調(diào)查單位總數(shù)
Si:各層調(diào)查單位平均數(shù)(成數(shù))的樣本標(biāo)準(zhǔn)差。
Ci:各層的抽樣費(fèi)用第55頁,共70頁。4、分層抽樣優(yōu)缺點(diǎn):精確:在對(duì)總體推斷時(shí),還可以對(duì)各層推斷復(fù)雜,操作困難度大,對(duì)各層的特征、大小都要有較精確的了解。5、適用場(chǎng)合:
要對(duì)總體和各層推斷要保證樣本的代表性:各層都有,可以提高代表性各層可以獨(dú)立調(diào)研第56頁,共70頁。4、整群抽樣1、含義:把整體按照某種標(biāo)準(zhǔn)劃分為一組子群,整體由許多子群體組成(自然或人為行成),各群之間特征相似。以群為抽樣單位,從群中隨機(jī)抽取,并對(duì)所選子群內(nèi)部進(jìn)行普查。這時(shí)所選中的各個(gè)子群的所有個(gè)體組成總體樣本。
可以理解為以子群為單位的隨機(jī)抽樣。
第57頁,共70頁。2、分群與精度:分群特征的選擇要保證群間差異小,群內(nèi)差異大。一般選擇與待研究?jī)?nèi)容無關(guān)的特征作為分群指標(biāo)。群間差異越?。ǔ闃樱?,群內(nèi)差異越大(普查),則精度越高。
第58頁,共70頁。3、采用原因:抽樣框易于獲得當(dāng)缺少基本單位名單難以從總體中直接抽取基本單位,而各個(gè)子群界限明顯,易于操作,避免了編織基本單位抽樣框問題。即使基本總體單位名單可獲得,但由于直接從基本單位名單抽樣獲得樣本較分散,會(huì)增加調(diào)查難度和費(fèi)用。而按照整群抽樣較集中,方便調(diào)查,費(fèi)用也低。當(dāng)各個(gè)子群之間差異不大時(shí),整群抽樣不會(huì)降低精度。第59頁,共70頁。4、注意問題:群間互斥對(duì)子群的抽樣為隨機(jī)抽樣。以利于后期數(shù)據(jù)處理和誤差估計(jì)。先部分后全部,與分層(先全部后部分)相反誤差取決于群間差異(群間抽樣),而不受群內(nèi)差異影響(群內(nèi)普查)第60頁,共70頁。5、多階段抽樣1、含義:復(fù)雜的、大規(guī)模調(diào)查中,調(diào)查單位一般不是直接抽取到,而采用多階段抽取,先按大的抽樣單位抽大的調(diào)查單元,再在大的樣本單位中按照小的抽樣單位抽取小的單元,以此類推。這種抽樣組織形式叫做對(duì)階段抽樣。
第61頁,共70頁。例如,全國城市住戶調(diào)查,先抽出城市,再抽出街道
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年智能樓宇管理師(初級(jí))建筑設(shè)備考試試卷
- 2025年質(zhì)量工程師質(zhì)量管理體系應(yīng)用試卷
- 2025年職業(yè)指導(dǎo)師中級(jí)專業(yè)能力試卷:職業(yè)發(fā)展與就業(yè)趨勢(shì)分析
- 2025瑞典語等級(jí)考試C30試卷:2025年度綜合能力提升
- 2025年注冊(cè)結(jié)構(gòu)工程師考試建筑結(jié)構(gòu)工程綠色建筑標(biāo)準(zhǔn)試卷
- 2025年注冊(cè)驗(yàn)船師考試船舶建造與修理技術(shù)考前沖刺試題
- 2025年珠寶首飾設(shè)計(jì)師職業(yè)技能鑒定試卷知識(shí)點(diǎn)精講
- 施工現(xiàn)場(chǎng)臨時(shí)電力供應(yīng)方案
- 二零二五年度城市更新改造項(xiàng)目房地產(chǎn)合作開發(fā)合同
- 2025版電網(wǎng)企業(yè)跨區(qū)域供電協(xié)議合同規(guī)范
- 中國人民公安大學(xué)《高等數(shù)學(xué)二》2023-2024學(xué)年第一學(xué)期期末試卷
- 快手非遺年度文化活動(dòng)《非遺不可》招商通案
- 汽車銷售顧問培訓(xùn)
- 2025年全國工會(huì)系統(tǒng)經(jīng)審業(yè)務(wù)技能大賽知識(shí)總題庫(1800題)-中部分
- 容量管理課件
- 公司航測(cè)無人機(jī)管理制度
- 2025屆山東省濟(jì)南市部分學(xué)校八年級(jí)英語第二學(xué)期期末檢測(cè)模擬試題含答案
- 2025四川省人力資源和社會(huì)保障廳制勞動(dòng)合同書
- 危險(xiǎn)廢物規(guī)范化省級(jí)評(píng)估指標(biāo)體系
- 電力工程施工應(yīng)急預(yù)案及安全措施
- (高清版)DB62∕T 3258-2023 建筑隔震工程施工及驗(yàn)收標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論