




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1第六章
總體均數(shù)的估計
2西南財經(jīng)大學近日發(fā)布《中國家庭金融調查報告》,報告顯示截至2011年8月,中國家庭資產(chǎn)平均為121.69萬元,城市家庭平均為247.60萬元,農(nóng)村家庭平均為37.70萬元。有網(wǎng)民說,看到這個數(shù)字第一個反應是自己“被平均了”。(據(jù)《現(xiàn)代快報》)3
10%的家庭收入占整個社會總收入的57%,5%家庭收入占整個社會總收入的44%,說明中國家庭收入不均等。
——李宏彬
中國城市家庭平均資產(chǎn)有200多萬,但平均資產(chǎn)的中位數(shù)只有40.5萬。兩者差距越大,表明財產(chǎn)分布越不均。
——甘犁
4城鎮(zhèn)單位職工平均工資(1952-2007)
567891011@火炮大師
:昨天晚上,老弟說去協(xié)和醫(yī)院給我嬸掛號看病。。。結果被工作人員告知,要排隊掛號的話,得排3天。。。我就XXX的?。?!這年頭看病也太恐怖了吧。。。廢話少說。。。上圖。。。你沒有看錯。。。這不是收容所。。。這都是排隊掛號的。。。。
12主要內(nèi)容均數(shù)的抽樣誤差與標準誤t分布總體均數(shù)的估計13一、均數(shù)的抽樣誤差總體樣本隨機抽樣推斷14
由于個體變異產(chǎn)生的,隨機抽樣引起的樣本統(tǒng)計量與總體參數(shù)之間的差異或各樣本統(tǒng)計量之間的差異稱為抽樣誤差。1.抽樣誤差(samplingerror)15
常把這種由抽樣研究造成的樣本均數(shù)與總體均數(shù)間的差異稱為均數(shù)的抽樣誤差。
由抽樣研究造成的樣本率與總體率間的差異稱為率的抽樣誤差。16
抽樣誤差是不可避免的,但能估計其大小。常用樣本均數(shù)的標準差作為衡量均數(shù)抽樣誤差大小的尺度。即均數(shù)標準誤。2.標準誤(Standarderror)17σ標準誤示意圖xμσpopulationx18抽樣試驗
從正態(tài)分布總體N(5.00,0.502)中,每次隨機抽取樣本含量n=5,并計算其均數(shù)與標準差;重復抽取1000次,獲得1000份樣本;計算1000份樣本的均數(shù)與標準差,并對1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實驗;比較計算結果。19抽樣試驗(n=5)2021抽樣試驗(n=10)2223抽樣試驗(n=30)24251000份樣本抽樣計算結果總體的均數(shù)總體標準差s均數(shù)的均數(shù)均數(shù)標準差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913263個抽樣實驗結果圖示:27抽樣實驗小結1.均數(shù)的均數(shù)圍繞總體均數(shù)上下波動。2.均數(shù)的標準差即標準誤
與總體標準差相差一個常數(shù)的倍數(shù),即3.從正態(tài)總體N(m,s2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(m,s2/n)
。281.從正態(tài)分布N(
,
2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布,樣本均數(shù)的總體均數(shù)仍為
,樣本均數(shù)的標準差為2.即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布;3.隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄。中心極限定理centrallimittheorem29從同一個總體做3次抽樣的結果圖示:30標準誤(standarderror)樣本均數(shù)的標準差稱標準誤,是說明均數(shù)抽樣誤差大小的指標,大,抽樣誤差大;反之,小,抽樣誤差小。標準誤的計算:標準誤的估計值:31影響標準誤大小的因素
的大小與
成正比與樣本含量n的平方根成反比32例6.1隨機抽取某地正常成年男性200名,測得其血清膽固醇的均數(shù)為3.64mmol/L,標準差為1.20mmol/L,試估計抽樣誤差:33例子6.2兩文獻表述有何區(qū)別34標準誤與標準差的區(qū)別:(1)概念不同
標準差是描述樣本個體值間的變異,標準差小,說明變量值圍繞均數(shù)的波動小,均數(shù)的代表性好。
標準誤是描述樣本均數(shù)的抽樣誤差,標準誤越小,表示樣本均數(shù)圍繞總體均數(shù)的波動越小。35(2)用途不同
標準差表示變量值對均數(shù)的波動大小,當資料呈正態(tài)分布時,與均數(shù)結合估計正常值范圍、計算變異系數(shù)、標準誤等。標準誤表示樣本統(tǒng)計量對總體參數(shù)的波動情況,用于估計參數(shù)的可信區(qū)間、進行假設檢驗。361)兩者均為變異指標;2)樣本含量不變時,均數(shù)的標準誤與標準差成正比;3)兩者均可與均數(shù)結合使用(但描述的內(nèi)容各不相同)。(3)聯(lián)系37在應用過程中要注意標準差和標準誤的區(qū)別:383940414243444546t分布
t分布的由來t分布的特征t分布曲線下的面積47總體
樣本均數(shù)
中心極限定理標準正態(tài)分布
標準正態(tài)分布
未知t分布
t分布的由來變量變換48如果抽取例數(shù)n=5的樣本k個,每個樣本又都可以按公式(9.20)計算出一個t值,可將k個t值編制成頻數(shù)表,作出直方圖,當k無限增大時,則可得到一條光滑的曲線。
(9.20
)同理,如果抽取例數(shù)n=10時,仍能得到一條t分布曲線,因此,當n變化時,就可以得到不同的t分布曲線,如下圖49xμpopulation
t1
t2
t3
tkN=5N=5N=5N=550xμpopulation
t1
t2
t3
tkN=10N=10N=10N=10圖3.2自由度分別為4、9、∞的t分布
52t分布曲線的特點
①單峰分布,曲線在t=0處最高,并以t=0為中心左右對稱②與正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高(見紅線)③其形態(tài)變化與自由度
的大小有關。自由度
越小,則t值越分散,曲線越低平;隨自由度增大,曲線逐漸接近正態(tài)分布。53
它與樣本例數(shù)n或自由度ν
有關,某個自由度對應于一條t分布曲線。當n或ν不同時,曲線形狀不同。當
時,t分布趨近于標準正態(tài)分布。自由度:ν=n-1隨機變量能夠自由取值的個數(shù)54t分布曲線下面積規(guī)律t分布曲線下總面積仍為1或100%由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個常量,而是隨自由度的大小而變化,如附表3。55附表3,t分布表的特點附表3的橫標目為自由度
,縱標目為概率P,表中數(shù)值為其相應的t界值,記作t
,
;t取值于某個區(qū)間的概率P相當與橫軸上該區(qū)間與曲線所夾面積。附表3給出了t分布曲線下單側或雙側尾部面積所對應的界值;雙側t0.05/2,9=2.262=單側t0.025.9單側t0.05,9=1.833雙側t0.05/2,∞=1.96=單側t0.025,∞單側t0.05,∞=1.64t分布曲線下面積57附表3只列出正值,若計算的t值為負值時,可用其絕對值查表。其通式為雙側:P(t≤-t
/2,
)+P(t≥t
/2,
)=
單側:P(t≤-t
,
)=
或P(t≥t
,
)=
圖中非陰影部分面積的概率為,P(-t
/2,
<t<t
/2,
)=1-
-t
,
t
,
2.5%2.5%0以下附圖的陰影部分表示t
,
以外尾部面積的概率。59二、總體均數(shù)的估計
參數(shù)的估計點估計:由樣本統(tǒng)計量直接估計總體參數(shù)缺點:沒有考慮抽樣誤差。區(qū)間估計:在一定可信度下,同時考慮抽樣誤差。601.點估計11名18歲男大學生身高均數(shù)資料得,
=172.25cm,S=3.31cm,試估計該地18歲男大學生身高總體均數(shù)?答:該地18歲男大學生身高總體均數(shù)為172.25cm612.區(qū)間估計
概念:即按一定的概率(1-
)估計總體均數(shù)所在的范圍。概率(1-
)稱為置信度。常取95%和99%,又稱置信區(qū)間(ConfidenceInterval,CI)。
62
有1-α的把握認為該區(qū)間包含了總體參數(shù)。而非總體參數(shù)落在該范圍的可能性為α。
置信區(qū)間的含義
63置信區(qū)間的確切含義
95%置信區(qū)間:從總體中作隨機抽樣,作100次抽樣,每個樣本可算得一個置信區(qū)間,得100個置信區(qū)間,平均有95個可信區(qū)間包括μ(估計正確),只有5個可信區(qū)間不包括μ(估計錯誤)。圖100個來自N(0,1)的樣本所估計的可信區(qū)間示意
65一次抽樣算得的置信區(qū)間,當
=0.05時,95%CI估計正確的概率為0.95,估計錯誤的概率小于或等于0.05,即有95%的可能性包含了總體均數(shù)。
66置信區(qū)間的兩個要素
準確度:反映在置信度(1-
)的大小上,即置信區(qū)間包含總體均數(shù)的可能性大小,從準確度的角度看,愈接近1愈好,如置信度99%比95%好。精密度:反映在置信區(qū)間的長度上,用區(qū)間長度CU-CL衡量。即長度愈小精密度愈好。67
在抽樣誤差確定的情況下,二者是相互矛盾的,若提高了可信度,可信區(qū)間勢必增大,精密度下降。一般情況下,常用95%置信區(qū)間。
在置信度確定的情況下,增加樣本含量可減小區(qū)間寬度。68
資料不同,總體均數(shù)的估計方法也不同,根據(jù)資料的條件,計算方法有三種:總體均數(shù)的置信區(qū)間估計方法(1)
未知,且n?。喊磘分布原理計算可信區(qū)間。
-t
,
t
,
2.5%2.5%0
由于:則:70所以,總體均數(shù)的100(1-α)%可信區(qū)間的通式為:
71例6.3:在某地成年男子中隨機抽取25人,測得其脈搏均數(shù)為72次/min,標準差為8次/min。試估計該地成年男性脈搏總體均數(shù)的95%置信區(qū)間。
=(68.7,75.3)次/分
根據(jù)樣本計算,可推斷該地成年男性脈搏總體均數(shù)的95%置信區(qū)間為(68.7,75.3)次/分。72(2)
未知,但n足夠大時(n>100),t分布逼近z分布。按z
分布原理計算可信區(qū)間。z
-z
由于:則:所以,總體均數(shù)的100(1-α)%之置信區(qū)間的通式為:
74例
測得某地110名18歲男大學生身高=172.73cm,s=4.09cm,估計該地18歲男大學生身高均數(shù)的95%可信區(qū)間。
本例n=110,=172.73cm,s=4.09cm,雙側z0.05/2=1.96按式(3.7)計算:即:該地18歲男大學生身高均數(shù)的95%可信區(qū)間為171.97cm~173.49cm75(3)σ已知:故可按正態(tài)分布原理估計總體均數(shù)的可信區(qū)間,計算公式為:76
未知,且n小
已知:
未知,但n足夠大:三種情況兩總體均數(shù)差值的置信區(qū)間(自學)
假設正態(tài)總體和,當,均未知,但時,則兩總體均數(shù)之差()的雙側()置信區(qū)間為:其中,,當n1,n2均較大時,差值的置信區(qū)間為:78例6.5測定28例結核病患者和34例對照者的腦脊液中鎂(mmol/L)的含量,結果見表6.5,試估計結核病人和對照者的腦脊液中鎂含量的總體均數(shù)之差的95%置信區(qū)間。
表6.5兩對比組腦脊液中鎂含量(mmol)
組別例數(shù)均數(shù)標準差結核組281.040.17對照組341.280.14解:假定兩組方差齊,根據(jù)公式6.7,6.8,6.9可得:
故兩總體均數(shù)之差的95%可信區(qū)間為(0.16,0.32)mmol/L80可信區(qū)間的注意問題1.可信區(qū)間的涵義意思是從總體中作隨機抽樣,每個樣本可以算得一個可信區(qū)間。如95%可信區(qū)間意味著做100次抽樣,算得100個可信區(qū)間,平均有95個估計正確,估計錯誤的只有5次。5%是小概率事件,實際發(fā)生的可能性很小,當然這種估計方法會有5%犯錯誤的風險。812.可信
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 漢字的形體演變探析
- 社區(qū)活動開幕詞范本
- 財務科技對傳統(tǒng)銀行的影響研究
- 金融科技在普惠金融中的應用探討
- 成功源于勤奮演講稿
- DB52T 453.6-2004 地產(chǎn)中藥材有害生物無害化治理技術規(guī)程 玄參
- 軍事理論-綜合版知到智慧樹見面課答案
- 水龍吟蘇軾課件
- Ubuntu Linux 22.04系統(tǒng)管理與服務器配置 課件 項目3 軟件包管理
- 機電設備安裝風機系統(tǒng)設計方案
- 《商務跨文化交際》課件
- 缺血性心肌病病人護理查房
- 《社保新政策解》課件
- 《基于UG的汽車機加件工時計算及系統(tǒng)開發(fā)》
- 房產(chǎn)代理轉讓合同范例
- GB/T 7247.1-2024激光產(chǎn)品的安全第1部分:設備分類和要求
- 2023銀行首屆夏日音樂會系列(天籟之音樂動一夏主題)活動策劃方案-106正式版
- 校服供貨服務方案
- 呼吸機斷電的應急演練
- 玉蘭花的栽培與管理方法
- 早期子宮內(nèi)膜癌患者保留生育功能治療專家共識
評論
0/150
提交評論