




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基礎(chǔ)統(tǒng)計學(初級)講義Paladinma
2011-6-22輕松學統(tǒng)計下列哪一種敘述方式最完整呢?背板螺孔扭力強度很好;背板螺孔扭力強度平均為10kg/cm^2;大多說產(chǎn)品的螺孔扭力強度在(10±0.8)kg/cm^2以內(nèi);99.73%的產(chǎn)品的螺孔扭力強度在(10±0.8)kg/cm^2以內(nèi)統(tǒng)計學的定義研究如何搜集資料、整理資料和進行數(shù)量分析、推斷的一門方法論科學。研究數(shù)量方面的研究客觀現(xiàn)象總體的數(shù)量特征研究不確定現(xiàn)象一門方法論的科學單個單個單個單個單個單個單個單個樣本不確定性:受到偶然的,隨機因素的作用統(tǒng)計學的分類理論統(tǒng)計學應用統(tǒng)計學基本統(tǒng)計量統(tǒng)計分布描述統(tǒng)計推斷統(tǒng)計參數(shù)估計非參數(shù)估計假設檢驗SPC相關(guān)/回歸分析方差分析(變異數(shù))實驗設計DOE多變量分析統(tǒng)計方法基礎(chǔ)篇應用篇統(tǒng)計能幫你、我做什么?問題之現(xiàn)狀分析真因驗證對策擬定效果確認解決問題思路1、敘述統(tǒng)計量2、估計1、假設檢驗2、ANOVA3、DOE1、假設檢驗2、回歸分析3、DOE1、假設檢驗2、估計Syllabus描述統(tǒng)計總體與樣本描述統(tǒng)計量統(tǒng)計分布描述及概率分布抽樣分布推斷統(tǒng)計估計假設檢驗計量型資料檢驗計數(shù)型資料檢驗統(tǒng)計測定的層次掌握統(tǒng)計測定的不同層次,對于正確地分析數(shù)據(jù)和選擇檢驗方法(參數(shù)檢驗、非參數(shù)檢驗)是十分重要的!統(tǒng)計要素一、總體(母體)客觀存在的,具有某種共同性質(zhì)的許多個體構(gòu)成的整體,由數(shù)據(jù)特性可分為:計量型總體:如長度、重量、時間等計數(shù)型總體:如男女、ok與ng等二、樣本:從總體中隨機抽取若干單位構(gòu)成的集合體一般n在30以下者稱為小樣本,n在30以上時稱為大樣本三、推斷以樣本所包含信息為基礎(chǔ)對總體的某些特征作出判斷,預測和估計。四、推斷的可靠性總體與樣本的關(guān)系明確調(diào)查的總體,從總體中抽取樣本并對樣本的信息加以分析,根據(jù)樣本信息對總體作出判斷,對推斷的可靠性加以測定。樣本總體抽樣/實驗推論隨機試驗、隨機事件、隨機變量在同一組條件下,對某事物或現(xiàn)象所進行的觀察或?qū)嶒灲须S機試驗(Experiment)把觀察或?qū)嶒灥慕Y(jié)果叫隨機事件。如果隨機試驗的每一種結(jié)果可以用一個數(shù)字作為其代表,則稱為隨機變量一、連續(xù)型continuous(計量型):可以用單位來度量二、離散型discrete(計數(shù)型):表現(xiàn)為屬性和類別基本統(tǒng)計量眾數(shù)中位數(shù)平均數(shù)四分位數(shù)極差-全距方差和標準差離散系數(shù)四分位差集中趨勢一組資料向其中心靠攏的傾向與程度集中趨勢及時尋找一般水平的代表值選用哪一個測量值來反映資料的集中趨勢,要根據(jù)資料的類型來決定。集中趨勢
眾數(shù):出現(xiàn)次數(shù)最多的資料點,可能沒有或有多個中位數(shù)QM:排序后,位于中間位置的值平均值:一組資料的均衡點所在各資料點與平均值間的距離和為0
各資料點與平均值間的距離平方和為最小最常用的量測值
四分位數(shù):用三個數(shù)值Q1、Q2、Q3把變量數(shù)列中全部單位分為四個部分,這三個數(shù)值稱為四分位數(shù)四分位數(shù)---箱線圖111212122231323414245152561626717278182891929102030四分位數(shù)---箱線圖(事例)眾數(shù)、中位數(shù)與平均值的關(guān)系眾數(shù)<中位數(shù)<平均數(shù)右偏分布平均數(shù)<中位數(shù)<眾數(shù)左偏分布分散趨勢反映各資料點遠離其中心的程度從另一個方式來說明集中趨勢的代表程度兩組數(shù)據(jù)的平均值相同,但上面的數(shù)據(jù)散布程度比較大分散趨勢全距R:數(shù)據(jù)資料中最大與最小之差Max-Min方差與標準差:離散系數(shù):指消除平均數(shù)影響后的標志變異指標,其形式為相對數(shù)。標準差系數(shù):標準差與其對應的平均值之比
---用于對不同資料組別的離散程度比較
---消除資料的不同水準和不同單位的影響分散程度---方差與標準差方差標準差總體樣本注意:樣本的方差分母用n-1去除分散程度---自由度指一個樣本中各隨機變量的數(shù)值可以自由變動的項數(shù)。如樣本中有n個隨機變量,每一項數(shù)值都可以自由變動,則其自由度為n;如n個隨機變量的平均數(shù)已確認,則只有n-1個隨機變量的數(shù)值可以自由變動,而剩余的另一個隨機變量必然由該平均數(shù)與n-1個隨機變量的數(shù)值所決定,不能自由變動,則這時n個隨機變量的自由度為 n-1。例如:樣本數(shù)為3,X1=2,X2=4,X3=9,則X=5。當X=5確定時,在X1,X2,X3中只能由兩個資料點可以自由取值,例如X1=6,X2=7,那X3必然為21、眾數(shù):40、46、592、中位數(shù)為Qm:第個數(shù),即為3、平均數(shù)為:Casestudy---各統(tǒng)計量的計算3434353536404040424245464646474849515255555859595960636465637865686870717373787981828485899496102102108Casestudy---各統(tǒng)計量的計算34343535364040404242454646464748495152555558595959606364656378656868707173737879818284858994961021021084、全距:5、方差:6、標準差:7、標準差系數(shù):利用excel的分析工具箱Note:excel之“工具”--〉”數(shù)據(jù)分析”--〉描述統(tǒng)計Syllabus描述統(tǒng)計總體與樣本描述統(tǒng)計量統(tǒng)計分布描述及概率分布抽樣分布推斷統(tǒng)計估計假設檢驗計量型資料檢驗計數(shù)型資料檢驗統(tǒng)計分布描述分布---分布的呈現(xiàn)分布圖---直方圖隨機變量的分布隨機變量的取值是隨機的,但內(nèi)在還是有規(guī)律性的,這個規(guī)律性可以用分布來描述。1、可能取什么值,或在哪個區(qū)間上取值。2、取這些值的概率各是多少,或在任一區(qū)間上取值的概率是多少?例如:擲一個骰子常用之分布(一)常用離散型分布---計數(shù)型數(shù)據(jù)1、二項分布2、泊松分布3、超幾何分布(二)正態(tài)分布---計量型數(shù)據(jù)(三)其他連續(xù)分布1、均勻分布2、對數(shù)正態(tài)分布3、指數(shù)分布二項分布由n次隨機試驗組成的隨機現(xiàn)象,它滿足如下條件1、重復進行n次隨機試驗;2、n次隨機試驗間相互獨立;3、每次試驗僅有兩個可能結(jié)果;4、每次試驗成功的概率均為p,失敗的概率均為1-p二項分布例:從不合格品率為0.1的成品中隨機抽取6個,計X為6個成品中的不合格數(shù),則X服從二項分布b(6,0.1),簡記X~b(6,0.1)P=0.3n=10,30,50,80n=30p=0.1,0.3,0.5,0.8二項分布特性1、當n愈大時,對稱性愈明顯2、當p愈接近0.5時,愈接近左右對稱實際應用np>=5&n(1-p)>=5時二項分布可用正態(tài)分布來描述泊松分布用來描述如下的隨機變量的概率分布1、在一定時間內(nèi),電話總站接錯電話的次數(shù)2、在一定時間內(nèi),某操作系統(tǒng)發(fā)生的故障3、一個鑄件上的缺陷數(shù)4、一平方米玻璃上氣泡的個數(shù)5、一件產(chǎn)品因擦傷留下的痕跡個數(shù)泊松分布總與計點過程相關(guān)聯(lián),并且計點是在一定時間內(nèi)、或一定區(qū)域內(nèi)、或一特定單位內(nèi)的前提下進行的,若λ表示某特定單位內(nèi)的平均點數(shù)(λ>0),令X表示出現(xiàn)的點數(shù),則X取x值的概率例:某公司一個月發(fā)生重大事故數(shù)X服從泊松分布,根據(jù)以往的記錄,該公司一個月平均發(fā)生1.2起重大事故,這表明:X服從λ=1.2的泊松分布。泊松分布超幾何分布從一個有限總體中進行不放回抽樣常遇到超幾何分布。設有N個產(chǎn)品組成的總體,其中含有M個不合格品。若從中隨機不放回地抽取n個產(chǎn)品,則其中不合品的個數(shù)X是一個離散隨機變量,假如n<=M,則X可能取0,1,2…n若n>M,則X可能取0,1,2…M其中r=min(n,M)例:20個樣品中,其中5個有缺陷,若從中隨機抽取8個,抽中缺陷的數(shù)量X的分布:在實際應用中,當n/N<=0.1,可以用二項概率去近似超幾何概率超幾何分布正態(tài)分布正態(tài)分布函數(shù)左右兩尾與橫軸漸漸接近但不相交正態(tài)分布有兩個變相點,分別在μ±σ對應的地方正態(tài)分布為左右對稱的概率分布正態(tài)分布隨機變量的線性函數(shù)仍為正態(tài)分布正態(tài)分布中心到各標準差(σ)之間的概率分布如下0.02150.13590.34130.68260.95440.9973標準正態(tài)分布假如X服從正態(tài)分布則Z=(X-μ)/σ會服從μ=0,σ=1的正態(tài)分布此時的正態(tài)分布稱為標準正態(tài)分布Z=(X-μ)/σ的轉(zhuǎn)換過程為標準化設X~N(μ,σ2
)則Z=~N(0,1)若X~N(10,4),通過標準化變換Z=~N(0,1)μσx0,1z正態(tài)分布在6σ界限內(nèi)居中的正態(tài)分布圖正態(tài)分布在偏移1.5σ情況下的正態(tài)分布圖μ標準正態(tài)分布---應用產(chǎn)品質(zhì)量特性X的不合格品率:例:某廠生產(chǎn)電阻的規(guī)格限為80±4,從現(xiàn)場得知電阻值X服從正態(tài)分布,均值μ=80.8,σ=1.3,則低于規(guī)格下限和規(guī)格上限的概率為:標準正態(tài)分布表Syllabus描述統(tǒng)計總體與樣本描述統(tǒng)計量統(tǒng)計分布描述及概率分布抽樣分布推斷統(tǒng)計估計假設檢驗計量型資料檢驗計數(shù)型資料檢驗抽樣分布所有的樣本統(tǒng)計量(平均值、比例、方差等)所形成的分布稱為抽樣分布結(jié)果來自樣本數(shù)目相同的所有可能樣本樣本平均值的抽樣分布樣本比例的抽樣分布樣本方差的抽樣分布樣本平均值的抽樣分布例:假設一總體含有四個元素,即總體之總個數(shù)N=4,四個元素分別為則總體的平均值、方差及分布如下:樣本平均值的抽樣分布若從總體中抽取n=2的隨機樣本,共有4*4=16個可能樣本,計算出各樣本之平均,并給出其平均值的分布。樣本平均值的抽樣分布樣本平均值的抽樣分布M為所有可能樣本數(shù)目比較與總結(jié):樣本平均的平均(數(shù)學期望)等于總體平均樣本平均的方差等于總體方差的1/n中央極限定理設從平均值為u,方差為σ2的一個任意分布總體(離散分布或連續(xù)分布、正態(tài)分布或非正態(tài)分布)中抽取個數(shù)為n的樣本,當n夠大時,樣本平均值的抽樣分布近似于平均值為u,方差數(shù)為σ2/n的正態(tài)分布一個任意分布的總體當樣本數(shù)足夠大時(n>30)樣本平均值得抽樣分布趨近于正態(tài)分布中央極限定理減少測量誤差的方法:對同一個零件的質(zhì)量特性作兩次或更多次重復測量,并用其均值去估計過程輸出的質(zhì)量特性,這可以減少標準差,從而測量系統(tǒng)的精度就自動增加了。這種簡易的方法可以使多次測量的平均值比單次測量值更具穩(wěn)定性!總體Ⅰ:均勻分布總體Ⅱ:雙峰分布總體Ⅲ:指數(shù)分布中央極限定理必須符合下列二條件:1、σ需已知2、樣本足夠大(n>30)思考:但大部分的情況σ是未知的,還可以用中央極限定理嗎?中央極限定理的限制T分布當σ未知,且樣本不夠大時,可以用樣本標準差s來替代σ,仍可得到跟正態(tài)分布接近的性質(zhì)此分布的自由度為n-1之t分布T分布可用于總體方差未知時正態(tài)總體均值的估計與檢驗,以及線性回歸模型中回歸系數(shù)的顯著性檢驗等n=∞n=20n=1T分布的性質(zhì)
T分布是均值為0的對稱的鐘形曲線,取值范圍在-∞與+∞之間;
T分布的方差大于1,與標準正態(tài)相比,t分布的中心部分較低,兩個尾部較高;隨著自由度n的不斷增大,t分布越來越趨近于標準正態(tài)分布,并以其為極限;
T(∞)≈N(0,1)不同自由度的t分布大樣本
(n≧30)中央極限定理正態(tài)總體σ已知正態(tài)分布性質(zhì)小樣本
(n﹤30)總體σ未知t分布性質(zhì)大樣本
(n≧30)中央極限定理非正態(tài)小樣本
(n﹤30)抽樣
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年骨科鍛煉試題及答案解析
- 2025年時政團員考試題及答案
- 2025年民生小事面試題目及答案
- 2025年初級c語言面試題及答案
- 東??h人民醫(yī)院2025年6月三基試卷及答案(檢驗專業(yè))
- 2025年河南省急救知識競賽題庫
- 汽車修理工(高級)考試題庫及答案
- 2025年填詞面試題目及答案解析
- 2025年商法試題及答案
- 2026屆高考英語總復習分類閱讀理解-應用文
- 2024年魯人新版三年級數(shù)學上冊月考試卷
- 鋼筋機械連接技術(shù)規(guī)程 JGJ 107-2016
- 上海市算力基礎(chǔ)設施發(fā)展報告2024年
- 爬架安裝培訓
- 集團總部薪酬管理制度
- 新能源汽車電池更換技術(shù)手冊
- LED戶外屏施工方案
- 2024至2030年中國晶圓代工行業(yè)市場供需形勢分析及投資前景評估報告
- 2024年山東省高考生物試卷(真題+答案)
- 腫瘤化療導致的中性粒細胞減少診治中國專家共識(2023版)解讀
- 2030年全球甲烷評估基準線報告
評論
0/150
提交評論