




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1
第七章樣本分布
數(shù)理統(tǒng)計(jì)是研究如何有效地收集、整理和分析帶有隨機(jī)影響的數(shù)據(jù),從而對(duì)所觀察的現(xiàn)象做出推斷或預(yù)測,為決策提供依據(jù)的一門學(xué)科。在近一個(gè)多世紀(jì)的發(fā)展中,數(shù)理統(tǒng)計(jì)不同程度地滲透到人類活動(dòng)的許多領(lǐng)域。人口調(diào)查、稅收預(yù)算、測量誤差、出生與死亡統(tǒng)計(jì)、保險(xiǎn)業(yè)中賠款額和保險(xiǎn)金的確定等,這些數(shù)理統(tǒng)計(jì)早期主要研究的問題,直到現(xiàn)在仍然值得認(rèn)真研究。在近半個(gè)世紀(jì)以來,數(shù)理統(tǒng)計(jì)在理論、方法、應(yīng)用上都有較大的發(fā)展。抽樣調(diào)查、試驗(yàn)設(shè)計(jì)、回歸分析與回歸診斷、多元分析、時(shí)間序列分析、非參數(shù)統(tǒng)計(jì)、統(tǒng)計(jì)決策函數(shù)、統(tǒng)計(jì)計(jì)算、隨機(jī)模擬、探索性數(shù)據(jù)分析等統(tǒng)計(jì)方法相繼產(chǎn)生并在實(shí)踐中普遍使用,把以描述為主的統(tǒng)計(jì)發(fā)展到以推斷為主的統(tǒng)計(jì)。數(shù)理統(tǒng)計(jì)的內(nèi)容已異常豐富,應(yīng)用廣泛,成為當(dāng)前最活躍的學(xué)科之一。2§7.1總體與樣本一、
總體與個(gè)體總體指研究對(duì)象的某項(xiàng)數(shù)量指標(biāo)值的全體。組成總體的每個(gè)元素稱為個(gè)體。由于每個(gè)個(gè)體的出現(xiàn)帶有隨機(jī)性,即相應(yīng)的數(shù)量指標(biāo)值的出現(xiàn)帶有隨機(jī)性。從而可把此種數(shù)量指標(biāo)看作隨機(jī)變量,我們用一個(gè)隨機(jī)變量及其分布來描述總體。為此常用隨機(jī)變量的符號(hào)或分布的符號(hào)X,Y,Z…,F(x)…來表示總體。例7.1研究某燈泡的使用壽命時(shí),總體可用隨機(jī)變量X來表示,或用其分布函數(shù)F(x)表示。3二、樣本為了推斷總體分布及其各種特征,就必須從總體中按一定法則抽取若干個(gè)體進(jìn)行觀測或試驗(yàn),以獲得有關(guān)總體的信息.這一抽取過程稱為抽樣.所抽取的部分個(gè)體稱為樣本,樣本中個(gè)體的數(shù)目稱為樣本容量.例如容量為n的樣本可以看作是n維隨機(jī)變量(
),其觀察值為(
).例7.2研究某地區(qū)學(xué)齡前兒童發(fā)育情況,人們關(guān)心的是其體重X和身高Y這兩個(gè)數(shù)量指標(biāo),則此總體就可用二維隨機(jī)變量(X,Y)或其聯(lián)合分布函數(shù)F(x,y)表示.4簡單隨機(jī)抽樣它要求滿足兩點(diǎn):(1)代表性.樣本中每個(gè)個(gè)體與所考慮的總體有相同的分布.即樣本中每個(gè)個(gè)體與總體X具有相同的分布.(2)獨(dú)立性.樣本中每個(gè)個(gè)體取什么值并不影響其它個(gè)體取什么值.即必須是相互獨(dú)立的隨機(jī)變量.由簡單隨機(jī)抽樣所得到的樣本稱為簡單隨機(jī)樣本.假如總體的分布函數(shù)為F(x),則其簡單隨機(jī)樣本的聯(lián)合分布函數(shù)為5三、分布族在概率論研究中,隨機(jī)變量的分布總是假設(shè)給定的,但在數(shù)理統(tǒng)計(jì)的研究中,總體的分布是未知的,但總可以假定總體的分布是某一個(gè)分布族的成員.例7.3在研究某批燈泡的質(zhì)量時(shí),若關(guān)心的是其質(zhì)量是否合格,若合格記為0,不合格記為1,因此該總體就可用僅取0和1的隨機(jī)變量X來表示.顯然,這個(gè)總體的分布就是一個(gè)參數(shù)為p的二點(diǎn)分布b(1,p),由于p未知,故這個(gè)總體分布也是未知的,但可以假定該總體分布是二點(diǎn)分布族
F={b(1,p);0<p<1}6若人們關(guān)心的是燈泡的壽命。這是一個(gè)無限總體。假如人們根據(jù)過去的資料知道燈泡的壽命X服從指數(shù)分布,其密度函數(shù)為
所需確定的參數(shù)是λ>0.7四、從樣本去認(rèn)識(shí)總體
⑴
頻數(shù)頻率分布表及其圖示例7.4我們通常飲用的礦泉水有19個(gè)指標(biāo).某市技術(shù)監(jiān)督局一次抽查了58批礦泉水,記錄每一批礦泉水的每個(gè)指標(biāo)是否合格,從中可統(tǒng)計(jì)出每批礦泉水不合格指標(biāo)的個(gè)數(shù)X.這里X是一個(gè)離散型隨機(jī)變量,其一切可能取值為0,1,…19。58批礦泉水的指標(biāo)不合格數(shù)構(gòu)成了一個(gè)容量為58的樣本的觀察值,每個(gè)可取0,1,…,19中某個(gè)值,將它們整理后列成表1.1.18表158批礦泉水不合格指標(biāo)數(shù)的頻率、頻數(shù)分布表910(2)
經(jīng)驗(yàn)分布函數(shù)樣本直方圖可以形象地去描述總體概率密度函數(shù)大致形狀,經(jīng)驗(yàn)分布函數(shù)將可以用來描述總體分布函數(shù)的大致形狀.定義1.1.1設(shè)總體X的分布函數(shù)為F(x),從中獲得的樣本觀察值為,將它們從小到大排列成,令
稱為該樣本的經(jīng)驗(yàn)分布函數(shù).11例7.5寫出經(jīng)驗(yàn)分布函數(shù)某食品廠用自動(dòng)裝罐機(jī)生產(chǎn)凈重量為345克的午餐肉罐頭,由于隨機(jī)性,每個(gè)罐頭的凈重有差別,現(xiàn)從中隨機(jī)取10個(gè)罐頭,其凈重如下:344,336,345,342,340,338,344,343,344,343,求經(jīng)驗(yàn)分布函數(shù).12
統(tǒng)計(jì)量及其分布
1.定義1.2.1設(shè)是取自某總體的一個(gè)容量為n的樣本,假如樣本函數(shù)
中不含任何未知參數(shù),則稱T為統(tǒng)計(jì)量.統(tǒng)計(jì)量的分布稱為抽樣分布.2.常用的幾個(gè)統(tǒng)計(jì)量設(shè)是來自總體X的樣本⑴樣本均值
樣本均值是反映總體數(shù)學(xué)期望所在位置信息的一個(gè)統(tǒng)計(jì)量,是總體數(shù)學(xué)期望的一個(gè)很好的估計(jì).13⑵樣本方差
樣本標(biāo)準(zhǔn)差
樣本方差與樣本標(biāo)準(zhǔn)差反映了數(shù)據(jù)取值分散與集中的程度,即反映了總體方差與標(biāo)準(zhǔn)差的信息.⑶樣本k階(原點(diǎn))矩樣本k階中心矩
它們分別反映了總體k階(原點(diǎn))矩與k階中心矩的信息.14⑷樣本偏度
SK反映了總體分布密度曲線的對(duì)稱性信息.當(dāng)SK>0時(shí),分布的形狀是右尾長,稱為正偏的;當(dāng)SK<0時(shí),分布的形狀是左尾長,稱為負(fù)偏的.⑸樣本峰度KU反映了總體分布密度曲線在其峰值附近的陡峭程度的信息,當(dāng)KU>0時(shí),分布密度曲線在其峰比正態(tài)分布來得陡;當(dāng)KU<0時(shí),比正態(tài)分布來得平坦.15⑹次序統(tǒng)計(jì)量
被稱為樣本的第i個(gè)次序統(tǒng)計(jì)量,它是樣本
的滿足如下條件的函數(shù):每當(dāng)樣本得到一組觀察值()時(shí),將它們從小到大排列為
,第i個(gè)值便是
的觀察值,稱為該樣本的次序統(tǒng)計(jì)量.又稱為該樣本的最小次序統(tǒng)計(jì)量,稱為該樣本的最大次序統(tǒng)計(jì)量.16⑺樣本極差
若樣本容量為n,則樣本極差它反映了樣本取值范圍的大小,也反映了總體取值分散與集中的程度.極差常在小樣本(n≤30)場合使用,而在大樣本場合很少在實(shí)際中使用.這是因?yàn)闃O差僅使用了樣本中兩個(gè)極端點(diǎn)的信息,而把中間的信息都丟棄了,當(dāng)樣本容量越大時(shí),丟棄的信息也就越多,從而留下的信息過少,其使用價(jià)值就不大了.17(8)樣本p分位數(shù)和中位數(shù)
定義
設(shè)是來自總體
F(x)
樣本,為該樣本的次序統(tǒng)計(jì)量.為該樣本的p分位數(shù)(或p分位點(diǎn)).
稱為樣本中位數(shù),
顯然有對(duì)于,稱18第一四分位數(shù)第三四分位數(shù)19例2設(shè)是F(x)
的樣本,此種統(tǒng)計(jì)量有個(gè),加起來平均得:令有從中任選兩個(gè)分量和
分別為總體均值與方差,2021幾種常用的分布族⑴分布Ⅰ定義:1.2.2設(shè)為相互獨(dú)立的隨機(jī)變量,且均服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),則稱隨機(jī)變量
服從自由度為n的分布,記作自由度可理解為平方和中獨(dú)立變量的個(gè)數(shù).Ⅱ分布性質(zhì)
(1)設(shè)
,則E(X)=n,D(X)=2n.(2)
可加性:設(shè)
,
,且X與Y獨(dú)立,則22下圖描繪了分布密度函數(shù)在n=5,10,20時(shí)的圖形.23(2)t分布①定義1.2.3:設(shè)X~N(0,1),,且X與Y獨(dú)立,則稱隨機(jī)變量
所服從的分布為t分布,記為T~t(n),稱n為自由度.24(3)F分布①定義1.2.4:設(shè)
,
,
且X與Y獨(dú)立,則稱隨機(jī)變量
服從自由度為(n,m)的F分布,記作.圖1.2.4描繪了的密度函數(shù)曲線25(4)Γ分布族定義1.2.5:定義在正實(shí)數(shù)上,且用密度函數(shù)表示的概率分布稱為Γ分布,記為Γ(α,λ).其中α>0是形狀參數(shù),λ>0是尺度參數(shù).而{Γ(α,λ);α>0,λ>0}就是Γ分布族當(dāng)α=1時(shí)的Γ分布為指數(shù)分布其密度曲線如下:2627Γ分布族性質(zhì)28(5)β分布族定義1.2.6:定義在[0,1]上,且密度函數(shù)表示的概率分布稱為β分布記為β(a,b),其中a>0,b>0.而{β(a,b):a>0,b>0}為β分布族. β分布有幾個(gè)重要的特例.當(dāng)a=1,b=1時(shí),β分布就是U(0,1)29隨機(jī)變量的分布的分位點(diǎn)1、設(shè)隨機(jī)變量X~F(x),給定常數(shù):0<<1,若存在,滿足,則稱為分布F(x)的上(側(cè))分位點(diǎn).2、設(shè)隨機(jī)變量X~N(0,1),給定常數(shù):0<<1,若存在,滿足,則稱為標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位點(diǎn).30標(biāo)準(zhǔn)正態(tài)分布的分位點(diǎn)0.0010.0050.010.0250.050.10
3.0902.5762.3271.961.6451.28231設(shè)X
~2(n),若對(duì)于:0<<1,滿足則稱為分布的上分位點(diǎn)。分布分位點(diǎn)32t分布分位點(diǎn)設(shè)T~t(n),若對(duì):0<<1,存在t(n),滿足P{T>t(n)}=,則稱t(n)為t(n)的上側(cè)分位點(diǎn).33F—分布的分位點(diǎn)設(shè)F~F(n1,n2)對(duì)于:0<<1,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 第八章 西北地區(qū) 單元說課稿-2025-2026學(xué)年八年級(jí)地理下學(xué)期人教版
- 2025年消費(fèi)與零售行業(yè)可持續(xù)消費(fèi)理念傳播策略分析報(bào)告
- 2025年中國高碳鋼砂行業(yè)市場分析及投資價(jià)值評(píng)估前景預(yù)測報(bào)告
- 2024-2025學(xué)年人教版物理八年級(jí)上冊(cè)5.1透鏡說課稿和說課稿
- 2025年中醫(yī)藥現(xiàn)代化進(jìn)程中塞舌爾市場拓展?jié)摿Ψ治鰣?bào)告
- 2025年儲(chǔ)能電池在數(shù)據(jù)中心能源管理中的應(yīng)用策略報(bào)告
- 第2課 學(xué)堂樂歌說課稿初中音樂教科版2024七年級(jí)上冊(cè)-教科版2024
- 2025年中國高鄰苯二甲酸酯增塑劑行業(yè)市場分析及投資價(jià)值評(píng)估前景預(yù)測報(bào)告
- 2025年中國高純氫氧化鈣行業(yè)市場分析及投資價(jià)值評(píng)估前景預(yù)測報(bào)告
- 口腔培訓(xùn)基本知識(shí)課件
- 2025年國家電網(wǎng)《安規(guī)》考試判斷題庫及答案
- 2025上海美術(shù)館招聘6人備考考試題庫附答案解析
- 檢驗(yàn)科二級(jí)生物實(shí)驗(yàn)室匯報(bào)
- 盾構(gòu)姿態(tài)監(jiān)測-洞察及研究
- 藥店店員技巧培訓(xùn)
- 2025年四川省巴中市中考數(shù)學(xué)試題
- 鄉(xiāng)村振興課件簡介模板
- (一檢)泉州市2026屆高三高中畢業(yè)班質(zhì)量監(jiān)測(一)數(shù)學(xué)試卷(含標(biāo)準(zhǔn)答案)
- 管道熱處理課件
- 2025成人高考試題真卷數(shù)學(xué)及答案
- 2025年京東集團(tuán)校招面試題與答案
評(píng)論
0/150
提交評(píng)論