大學(xué)文科數(shù)學(xué) 數(shù)理統(tǒng)計_第1頁
大學(xué)文科數(shù)學(xué) 數(shù)理統(tǒng)計_第2頁
大學(xué)文科數(shù)學(xué) 數(shù)理統(tǒng)計_第3頁
大學(xué)文科數(shù)學(xué) 數(shù)理統(tǒng)計_第4頁
大學(xué)文科數(shù)學(xué) 數(shù)理統(tǒng)計_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

會計學(xué)1大學(xué)文科數(shù)學(xué)數(shù)理統(tǒng)計文科數(shù)學(xué)§5

數(shù)理統(tǒng)計1996年,美國學(xué)者D.Vchida,M.J.Cetron,F.Mckenjie發(fā)表了一篇論文:“學(xué)生必須掌握哪些知識和技能才能在21世紀(jì)立于不敗之地”,該文提到:運用數(shù)學(xué)、邏輯和推理的技能;熟練的讀寫能力以及了解統(tǒng)計學(xué)此處的統(tǒng)計學(xué),就是指“研究以及解釋和運用數(shù)據(jù)的能力”的學(xué)科。介紹數(shù)理統(tǒng)計中的兩個最基本問題的主要思想。第1頁/共36頁文科數(shù)學(xué)1、藥效問題

某地區(qū)豬患某種病的概率是0.25,且每頭豬患病與否與其他豬無關(guān)。今研制了一種新的預(yù)防藥,選用12頭豬作實驗,結(jié)果這12頭豬服用了此種藥后均未患病,問此藥是否有效?一、假設(shè)檢驗問題

分析:取樣12頭豬,服藥后均未患病,據(jù)此判斷藥是否有效。直觀認(rèn)為:藥一定有效。(豬確實沒有生病嘛?。┳屑?xì)分析:可能存在問題?。ù蟛糠重i不服藥也不會患病,患病概率僅為0.25)12頭豬都未患病未必是藥的作用!第2頁/共36頁文科數(shù)學(xué)自然想法:(類似于反證法)若這事件發(fā)生的概率很小,即這件事幾乎不會發(fā)生,若藥無效,12頭豬均未患病的可能性有多大?那么它的發(fā)生應(yīng)歸于藥的效果。在“藥無效”的假設(shè)下,12頭豬均未患病的概率為P{12頭豬均未患病}這是小概率事件,即這件事幾乎不會發(fā)生(理論上)?!?/p>

但它恰是我們?nèi)拥慕Y(jié)果,即它實際發(fā)生了,說明假設(shè)錯誤,從而否定“藥無效”的假設(shè),即認(rèn)為藥有效。第3頁/共36頁文科數(shù)學(xué)結(jié)論

由于小概率事件(即幾乎不會發(fā)生的事件)發(fā)生了,從而否定原先的假設(shè)“藥無效”?!?/p>

概率很小的事件并非絕對不可能發(fā)生:所以據(jù)此否定“藥無效”這一命題,也有可能會犯錯誤,{12頭豬均未患病}發(fā)生的概率為0.032犯錯誤的概率為0.032。所以該問題的確切表述應(yīng)為:有1-0.032=0.968的概率認(rèn)為“藥有效”進一步討論第4頁/共36頁文科數(shù)學(xué)2、產(chǎn)品檢驗問題180個產(chǎn)品包成一包,若每包產(chǎn)品中次品數(shù)不超過8個就認(rèn)為這包產(chǎn)品合格?,F(xiàn)有一買主挑選了一包,從中任取4個產(chǎn)品,發(fā)現(xiàn)其中有2個次品,問該包產(chǎn)品是否合格?

分析:取樣4個產(chǎn)品,發(fā)現(xiàn)有2個是次品,據(jù)此判斷這包產(chǎn)品是否合格。(即能否由此判斷180個產(chǎn)品里次品數(shù)不超過8個)第5頁/共36頁文科數(shù)學(xué)仔細(xì)分析先假設(shè)這包產(chǎn)品中有8個次品,172個正品,即這包則從中任取4個恰取到k

個次品的概率為合格,具體結(jié)果如下

可見:任取4個產(chǎn)品,其中次品數(shù)多于1個的概率不到1%(0.0097+0.0002+0.0000=0.0099)。k01234pk0.83240.15760.00970.00020.0000第6頁/共36頁文科數(shù)學(xué)

想象:若這包產(chǎn)品中次品數(shù)比8個還少,則任取4個產(chǎn)品,其中次品數(shù)多于1個的概率就會更小。

所以:若這包產(chǎn)品合格,即次品數(shù)不超過8個,則“任取4個產(chǎn)品,次品數(shù)多于1個”是小概率事件,不應(yīng)發(fā)生。結(jié)論:取到2個次品,否定“這包產(chǎn)品合格”。有99%的把握認(rèn)為這包產(chǎn)品不合格

可見:任取4個產(chǎn)品,其中次品數(shù)多于1個的概率不到1%(0.0097+0.0002+0.0000=0.0099)。仔細(xì)分析第7頁/共36頁文科數(shù)學(xué)假設(shè)檢驗問題

要判斷的命題稱為“統(tǒng)計假設(shè)”或“假設(shè)”;

判斷命題正確與否的做法稱為“檢驗”;

這類問題稱為“假設(shè)檢驗”。如:要判斷“本地農(nóng)戶平均收入超過5000元”,“肺癌與吸煙無關(guān)”等如:“小概率事件在一次試驗中不應(yīng)該發(fā)生”等數(shù)理統(tǒng)計中的兩類基本問題之一

特性:否定與肯定“假設(shè)”都會犯錯誤,此由隨機現(xiàn)象本性所決定,不可避免??刂品稿e誤的概率!第8頁/共36頁文科數(shù)學(xué)3、骰子的均勻性

在賭博中,判斷骰子是否均勻(即每面向上的概率是否都為1/6)是非常重要的。

試驗:一枚骰子擲了次,其中1點出現(xiàn)了次。問題簡化:考慮“1點向上”的概率是否為1/6。據(jù)此判斷“1點出現(xiàn)的概率為1/6”這一假設(shè)是否成立分析:由試驗,“1點出現(xiàn)”的頻率為該頻率與1/6相差極小,是否可以認(rèn)為假設(shè)成立?第9頁/共36頁文科數(shù)學(xué)誤差0.0000333…如何解釋?現(xiàn)令:X為擲次骰子時1點出現(xiàn)的次數(shù),還是骰子本身均勻,該誤差僅是合理的隨機誤差?則

X的概率分布為由骰子不均勻引起?其中p為每次投擲時1點出現(xiàn)的概率。若“1點出現(xiàn)的概率為1/6”這一假設(shè)成立,即仔細(xì)分析p=1/6,則上式變?yōu)榈?0頁/共36頁文科數(shù)學(xué)實際情況:1點出現(xiàn)了次,而計算可知:對于均勻骰子來講是不可能發(fā)生的(概率不足百萬分之一)。此外:1點出現(xiàn)的頻率X/n

與1/6的差應(yīng)滿足因此:否定“1點出現(xiàn)的概率為1/6”這一假設(shè)。第11頁/共36頁文科數(shù)學(xué)即頻率X/n

與1/6的差不應(yīng)超過但實際差距是0.0000333…,與0.0000008相比太大概率不足百萬分之一的事件發(fā)生了,從而否定“1點出現(xiàn)的概率為1/6”這一假設(shè)了,第12頁/共36頁文科數(shù)學(xué)1、概率分布的估計為了估計某個事件A的概率p,二、估計問題作n次試驗(觀察),看看A發(fā)生了幾次。設(shè)A恰好發(fā)生了k

次,則可用頻率

作為事件A

事件發(fā)生概率的估計的概率p

的估計值。顯然,n越大,該估計越好!第13頁/共36頁文科數(shù)學(xué)

離散型概率分布的估計

例如:估計某商店周日上午8點至12點間每分鐘到達(dá)的顧客數(shù)X

的分布。X

可能的取值為0,1,2,…,只需對任意數(shù)k,估計進行試驗:觀測了20個周日的數(shù)據(jù),共4800分鐘,記錄下每分鐘到達(dá)的顧客數(shù)(4800個數(shù)據(jù))。設(shè)到達(dá)k

個顧客的分鐘數(shù)為tk令則X

的概率分布為用頻率估計概率!第14頁/共36頁文科數(shù)學(xué)2、參數(shù)的估計估計問題是建立數(shù)學(xué)模型中不可缺少的部分。任何模型,包括確定性模型總有待定的參數(shù),需要通過對實際問題的觀測(試驗)來確定。由于觀測(試驗)具有誤差,觀測值具有隨機性,從而得不到精確結(jié)論。

因此我們不說“求”概率p,“求”參數(shù)a,而說“估計”p,“估計”a。目標(biāo):估計均值、方差等參數(shù)。例如:估計森林的木材儲量等。首要問題:估計的方法!第15頁/共36頁文科數(shù)學(xué)

例如:估計某地區(qū)農(nóng)戶的平均收入(農(nóng)戶收入的均值a)。試驗:隨機地抽取n戶,收入分別為方法1:用平均收入來估計整個地區(qū)農(nóng)戶的平均收入a。方法2:去掉一個最高值及一個最低值再求平均來估計整個地區(qū)農(nóng)戶的平均收入a。第16頁/共36頁文科數(shù)學(xué)

不同估計方法的實質(zhì)就是的不同函數(shù),稱其為估計量。

一旦做了試驗,抽取了數(shù)據(jù),針對要估計的量(參數(shù)),首先要找出估計的方法(估計量)。一般而言,要找一個“合理”的估計方法并不容易,而且估計方法的尋找依賴于實際問題的背景。說明:“估計”有確切含義!

之所以稱為“估計”,不是因為精度差,不準(zhǔn)確!而是強調(diào)了估計量是一個隨機變量,因為討論的基礎(chǔ)是一組隨機數(shù)據(jù)。(形象的稱為“數(shù)據(jù)加工的函數(shù)”)這種使用“樣本值函數(shù)”估計的方法稱為矩估計法。第17頁/共36頁文科數(shù)學(xué)例1、汽車產(chǎn)量的估計

早期情報人員曾通過觀察敵方城市中汽車牌照號碼來估計其汽車產(chǎn)量。為簡單起見,設(shè)汽車牌照號碼是按自然順序1開始排列的?,F(xiàn)把號碼,例如03402,看成是一個小數(shù),即0.03402,把號碼對應(yīng)于區(qū)間(0,1)中的一個數(shù)。所有汽車中的最大號碼(恰是汽車的產(chǎn)量)對應(yīng)于區(qū)間(0,1)中未知的參數(shù)θ。現(xiàn)隨機地在城市中觀測n個汽車號碼,它們對應(yīng)于區(qū)間(0,θ)中的n個數(shù)。

問:如何用這n個數(shù)對參數(shù)θ

作出估計?第18頁/共36頁文科數(shù)學(xué)方法1:由于觀測的隨機性,可認(rèn)為在區(qū)間(0,θ)內(nèi)“均勻”地分布著,故可用它們的平均值估計區(qū)間(0,θ)的中點,從而用估計θ。例1、汽車產(chǎn)量的估計第19頁/共36頁文科數(shù)學(xué)方法2:把(0,θ)分成了n+1個小區(qū)間,當(dāng)?shù)拈L度估計,在區(qū)間(0,θ)內(nèi)“均勻”分布時,每個小區(qū)間長度相差不大,都和近似。故可以用某一區(qū)間的長度,例如最左邊的小區(qū)間即用例1、汽車產(chǎn)量的估計來估計θ。第20頁/共36頁文科數(shù)學(xué)長度并不完全相等,是左邊n個小區(qū)間的長度無論選擇哪個來估計都不夠“精確”,為此考慮它們的“平均長度”。由于我們用來估計每個小區(qū)例1、汽車產(chǎn)量的估計方法3:把(0,θ)分成了n+1個小區(qū)間,之和,間的長度,即用來估計θ。第21頁/共36頁文科數(shù)學(xué)例2、敏感性問題調(diào)查

在社會調(diào)查用頻率估計概率時,有些敏感的問題人們往往不愿意如實回答。如“你考試時作過弊嗎?”,“你在超市偷拿過商品嗎?”。由于不能直接得到概率p的估計,通常是估計一個和p有關(guān)的量,然后算出p的估計。回憶例1所用方法。對敏感性問題的調(diào)查,有一種巧妙的隨機應(yīng)答方法(S.L.Wamer,1965)。第22頁/共36頁文科數(shù)學(xué)

方法:要求被調(diào)查者在兩個問題中隨機地選一個回答(只回答“是”或“不是”),而不必告訴別人他回答的是哪一個問題,其中一個問題是要調(diào)查的敏感問題,另一個是無關(guān)緊要的問題。

例如:設(shè)敏感問題是“你考試作過弊嗎?”,另一問題是“你出生的年份最后一位數(shù)是偶數(shù)嗎?”。

做法:讓被調(diào)查者擲一枚硬幣(別人看不到),出現(xiàn)正面時回答前一個問題,否則回答后一個問題,具體回答哪一個問題只有他本人知道。下面做具體分析。例2、敏感性問題調(diào)查第23頁/共36頁文科數(shù)學(xué)

假設(shè)對200人做了調(diào)查,其中58人回答“是”。由于硬幣的均勻性:可以估計約100人回答了第2個問題,另100人回答了第1個問題。又出生年份最后一位是偶數(shù)與奇數(shù)的機會相同:回答第2個問題的100人中約有50個人回答“是”。從而:回答第1個問題的100人中約有58-50=8人回答了“是”,即“考試中作過弊”的人約占。具體分析例2、敏感性問題調(diào)查第24頁/共36頁文科數(shù)學(xué)

方法的實質(zhì):知道回答第1個問題的人的概率(擲硬幣試驗),(當(dāng)然并不要求概率一定是1/2,如拋骰子試驗)也知道第2個問題回答“是”的概率(數(shù)的奇偶性),(也不要求概率一定是1/2)從而可以給出p的估計。例2、敏感性問題調(diào)查第25頁/共36頁文科數(shù)學(xué)

將例2中第2個問題改為“你的生日是1月份嗎?”,把硬幣改為骰子,當(dāng)擲出1點或2點時回答第2個問題,否則回答第1個問題。若調(diào)查了900人有72人回答“是”,試給出p

的估計。

例習(xí)分析:p1=1/12,p2=1/3回答問題2:900×1/3=300回答問題1:900×2/3=600回答問題2“是”:300×1/12=25回答問題1“是”:72-25=47p≈47/600第26頁/共36頁文科數(shù)學(xué)例3、湖中魚數(shù)的估計

湖中魚數(shù)N未知,今捕上M條魚,作上記號后均勻地放回湖中,再捕上n條,若其中k條有記號,試估計湖中魚數(shù)N。

方法1:由于有記號的魚已均勻地分布在湖中,有記號的魚在湖中占的比例應(yīng)和第二次捕的魚中占的比例近似,即故用估計N(取最近的正整數(shù))。第27頁/共36頁文科數(shù)學(xué)

方法2:當(dāng)有記號的魚在湖中均勻地分布時P{捕n條魚中有k條有記號}?為什么第二次捕n條魚時,恰好捕到了k條有記號的魚呢?可以認(rèn)為這件事發(fā)生的概率很大!所以對N的估計應(yīng)該使上述概率達(dá)到極大!考慮例3、湖中魚數(shù)的估計第28頁/共36頁文科數(shù)學(xué)P{捕n條魚中有k條有記號}可見:當(dāng),即當(dāng),即從而使f(N)達(dá)到極大的N的估計值應(yīng)滿足與方法1所得結(jié)果一致。第29頁/共36頁文科數(shù)學(xué)極大似然思想:

做了一次試驗,結(jié)果事件A發(fā)生了,則參數(shù)的選?。垂烙嫞?yīng)使事件A

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論