




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
異常值的識(shí)別與處理箱式圖亦稱盒形圖(boxplot),箱須圖(box-whiskerplot),統(tǒng)計(jì)圖表一章中已討論。利用中位數(shù)、上下四分位數(shù)來(lái)描述數(shù)據(jù)分布的中心位置和分布范圍。
。如果分布是對(duì)稱的,上下四分位數(shù)與中位數(shù)的距離(空間)應(yīng)相等;如果上四分位數(shù)比下四分位數(shù)離中位數(shù)更遠(yuǎn),則此分布是正偏;反之,負(fù)偏。箱圖(boxplot)也稱箱須圖(box-whiskerplot),用于反映一組或多組連續(xù)型定量數(shù)據(jù)分布的中心位置和分布范圍。
異常值(outlyingvalue,outlier)定義:一個(gè)觀察值x如屬于下面情形之一,則為異常值。若一個(gè)觀察值x屬于下面情形之一,則稱為極端異常值(extremeoutlyingvalue)。對(duì)于箱式圖在樣本中從上四分位數(shù)到最大的非異常值之間畫(huà)一垂直的條形;在樣本中從下四分位數(shù)到最小的非異常值之間畫(huà)一垂直的條形;在樣本箱式圖中識(shí)別異常值和極端異常值,并分別用“0”及“*”表示。抽樣誤差用上述方法識(shí)別異常值是描述性的,它對(duì)樣本大小很敏感,即大樣本時(shí)可能有更多的“異常值”被檢查出來(lái);因此,識(shí)別異常值的最好應(yīng)建立在假設(shè)檢驗(yàn)的基礎(chǔ)上。異常值的認(rèn)識(shí)前面定性描述了可能存在異常值,實(shí)際上某些異常值有時(shí)會(huì)對(duì)研究結(jié)論產(chǎn)生重要影響。識(shí)別異常值并將其排除在外,或至少作出有無(wú)異常值的統(tǒng)計(jì)結(jié)論。異常值的定量描述常用方法是以遠(yuǎn)離均數(shù)的標(biāo)準(zhǔn)差倍數(shù)的多少倍來(lái)描述。在一個(gè)樣本中把這個(gè)統(tǒng)計(jì)量應(yīng)用于最極端的觀察值時(shí)稱為極端學(xué)生化偏差(extremestudentizeddeviate,ESD)。EDS應(yīng)取多大才能列為異常值?回答是與樣本含量n有關(guān)。對(duì)于樣本含量為n的正態(tài)分布,建立在ESD統(tǒng)計(jì)量上的抽樣分布的臨界值由B.Rosner(1983)給出,列于表10。記?。捍私缰狄蕾囉趎及你定義的第p個(gè)百分位點(diǎn),因此該統(tǒng)計(jì)量的分界點(diǎn)記為ESDn,p。單個(gè)異常值的判斷:若ESD>該界值,則認(rèn)為該觀察值是異常值;反之不認(rèn)為存在異常值。異常值的定量描述多個(gè)異常值的判斷設(shè)x1,…,xn中大多數(shù)數(shù)據(jù)呈正態(tài)分布,但我們懷疑有k個(gè)異常點(diǎn),此處k=min([n/10],5)
其中[n/10]是一個(gè)不超過(guò)n/10的最大整數(shù)。H0:沒(méi)有異常值;H1:至少有1個(gè)但不超過(guò)k個(gè)異常值。用下面的法則去識(shí)別異常值:識(shí)別多個(gè)異常值的法則記x(n)點(diǎn)上達(dá)到ESD,其值為ESD(n);移去x(n),再重新計(jì)算均數(shù)、標(biāo)準(zhǔn)差、ESD等,在樣本點(diǎn)x(n-1)達(dá)到ESD,其值為ESD(n-1);類(lèi)推,直到有k個(gè)ESD值:ESD(n),ESD(n-1),…,ESD(n-k+1)。與其對(duì)應(yīng)的原始數(shù)據(jù)為x(n),x(n-1),…,
x(n-k+1)。從附表10找出每一個(gè)ESD對(duì)應(yīng)的界值,分別判斷之。除非我們很有把握知道只可能有一個(gè)異常值,一般情況下應(yīng)按多個(gè)異常值來(lái)處理。若發(fā)現(xiàn)有異常值,又該怎么辦?異常值的處理方法一,將有異常值與刪去異常值情形下去分析數(shù)據(jù)以便比較;也可以不刪去異常值,但將它們?cè)跀?shù)據(jù)分析中的作用盡量減少:①秩轉(zhuǎn)換非參數(shù)統(tǒng)計(jì)分析;②穩(wěn)健
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年咸陽(yáng)亨通電力(集團(tuán))有限公司招聘(4人)模擬試卷及完整答案詳解一套
- 2025年電阻傳感器項(xiàng)目申請(qǐng)報(bào)告
- 2025甘肅張掖市幼兒園選調(diào)衛(wèi)生保健人員1人模擬試卷及答案詳解(奪冠系列)
- 項(xiàng)目款項(xiàng)結(jié)算責(zé)任聲明書(shū)3篇范文
- 2025年特殊教育服務(wù)項(xiàng)目申請(qǐng)報(bào)告
- 產(chǎn)品質(zhì)量問(wèn)題原因分析與解決方案工具
- 2025年甘肅省民航航空發(fā)展有限公司職業(yè)經(jīng)理人選聘模擬試卷及答案詳解(易錯(cuò)題)
- 2025年上半年龍泉市公開(kāi)選調(diào)公務(wù)員及選聘事業(yè)單位工作人員14模擬試卷及答案詳解一套
- 信任守護(hù)服務(wù)品質(zhì)承諾書(shū)6篇
- 2025藍(lán)海新材料(通州灣)有限責(zé)任公司春季高校畢業(yè)生招聘45人模擬試卷附答案詳解(黃金題型)
- 《公路技術(shù)狀況評(píng)定》課件-任務(wù)六:公路技術(shù)狀況指數(shù)MQI
- Unit 3 Amazing animals Section A What pets do you know 說(shuō)課(教學(xué)設(shè)計(jì))-2024-2025學(xué)年人教PEP版(2024)英語(yǔ)三年級(jí)上冊(cè)
- 中級(jí)財(cái)務(wù)會(huì)計(jì)知到課后答案智慧樹(shù)章節(jié)測(cè)試答案2025年春云南財(cái)經(jīng)大學(xué)
- 2025青海省建筑安全員B證考試題庫(kù)及答案
- 現(xiàn)代紡織物清潔技術(shù)培訓(xùn)匯報(bào)教程
- 《鐵路技術(shù)管理規(guī)程》(普速鐵路部分)
- 臨床檢驗(yàn)基礎(chǔ)知到智慧樹(shù)章節(jié)測(cè)試課后答案2024年秋上海健康醫(yī)學(xué)院
- 鑄牢中華民族共同體意識(shí)心得感悟7篇
- 《中國(guó)海洋大學(xué)》課件
- 神話故事民間故事《后羿射日》繪本課件
- “雄鷹杯”全國(guó)小動(dòng)物醫(yī)師技能大賽考試題庫(kù)(660題)
評(píng)論
0/150
提交評(píng)論