統(tǒng)計學(xué)第三章變量分布特征的描述_第1頁
統(tǒng)計學(xué)第三章變量分布特征的描述_第2頁
統(tǒng)計學(xué)第三章變量分布特征的描述_第3頁
統(tǒng)計學(xué)第三章變量分布特征的描述_第4頁
統(tǒng)計學(xué)第三章變量分布特征的描述_第5頁
已閱讀5頁,還剩113頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學(xué)第三章變量分布特征的描述第1頁,共118頁,2023年,2月20日,星期日學(xué)習(xí)要求①理解變量分布三大特征即集中趨勢、離中趨勢和分布形狀的的含義;②理解平均指標、離散指標和形狀指標的意義與作用;③熟練掌握各種平均數(shù)的計算方法并加以正確的應(yīng)用,科學(xué)理解加權(quán)平均數(shù)中權(quán)數(shù)的意義,正確認識算術(shù)平均數(shù)與調(diào)和平均數(shù)之間的應(yīng)用關(guān)系,以及算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者之間的數(shù)量關(guān)系;④熟練掌握各種離散指標的計算方法并加以正確的應(yīng)用,尤其是要深刻理解方差、標準差和離散系數(shù)的內(nèi)涵;⑤熟練掌握偏度系數(shù)和峰度系數(shù)的計算方法并加以正確的應(yīng)用,尤其是要了解動差的含義。第2頁,共118頁,2023年,2月20日,星期日變量分布特征集中趨勢

(位置)離中趨勢

(分散程度)偏態(tài)和峰度(形狀)第3頁,共118頁,2023年,2月20日,星期日數(shù)據(jù)分布的測度峰度偏態(tài)數(shù)據(jù)的特征和測度分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)變異系數(shù)方差和標準差四分位差極差位置平均數(shù)數(shù)值平均數(shù)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)第4頁,共118頁,2023年,2月20日,星期日第一節(jié)集中趨勢的描述集中趨勢

亦稱為趨中性,是指變量分布以某一數(shù)值為中心的傾向,一般用平均指標來表示。一、集中趨勢與平均指標平均指標主要用來表明同質(zhì)總體中某一標志值,在一定時間、地點條件下所達到的一般水平。其數(shù)值表現(xiàn)平均數(shù)。概念第5頁,共118頁,2023年,2月20日,星期日平均指標的種類從總體各單位變量值中抽象出具有一般水平的量,這個量是根據(jù)各個單位的具體標志值計算出來的,有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)等形式。數(shù)值平均數(shù)1、反映時間不同,分為靜態(tài)和動態(tài)平均數(shù)。2、取得集中趨勢代表值方法的不同,可分為數(shù)值平均數(shù)和位置平均數(shù)。先將總體各單位的變量值按一定順序排列,然后取某一位置的變量值來反映總體各單位的一般水平。位置平均數(shù)有眾數(shù)、中位數(shù)、四分位數(shù)等形式。位置平均數(shù)第6頁,共118頁,2023年,2月20日,星期日

算術(shù)平均數(shù)

計算平均數(shù)調(diào)和平均數(shù)靜態(tài)平均數(shù)幾何平均數(shù)位置平均數(shù)眾數(shù)平均指標中位數(shù)分位數(shù)發(fā)展水平平均數(shù)動態(tài)平均數(shù)發(fā)展速度平均數(shù)第7頁,共118頁,2023年,2月20日,星期日平均指標的作用(1)通過反映變量分布的一般水平,幫助人們對研究現(xiàn)象的一般數(shù)量特征有一個客觀的認識。(2)利用平均指標可以對不同空間的發(fā)展水平進行比較。(3)利用平均指標可以對某一現(xiàn)象總體在不同時間上的發(fā)展水平進行比較,以說明這種現(xiàn)象發(fā)展變化的趨勢或規(guī)律性。(4)利用平均指標可以分析現(xiàn)象之間的依存關(guān)系或進行數(shù)量上的推算。(5)平均指標還可以作為研究和評價事物的一種數(shù)量標準或參考。第8頁,共118頁,2023年,2月20日,星期日二、數(shù)值(計算)平均數(shù)數(shù)值平均數(shù)調(diào)和平均數(shù)算術(shù)平均數(shù)幾何平均數(shù)第9頁,共118頁,2023年,2月20日,星期日(一)算術(shù)平均數(shù)算術(shù)平均數(shù)一般就稱為平均數(shù)(mean)。其定義是:觀察值的總和除以觀察值個數(shù)的商。在實際工作中,由于所掌握的統(tǒng)計資料的不同,利用上述公式進行計算時,可分為簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)兩種。簡單算術(shù)平均數(shù)

(SimpleArithmeticMean)

加權(quán)算術(shù)平均數(shù)

(WeightedArithmeticMean)

第10頁,共118頁,2023年,2月20日,星期日1.簡單算術(shù)平均數(shù)

簡單算術(shù)平均數(shù)的公式根據(jù)未經(jīng)分組整理的原始數(shù)據(jù)計算的均值。設(shè)一組數(shù)據(jù)為x1,x2,x3,…xn.則簡單算術(shù)平均數(shù)的計算公式如下:第11頁,共118頁,2023年,2月20日,星期日例1:據(jù)南方人才服務(wù)中心調(diào)查,從事IT行業(yè)的從業(yè)人員年薪在40000-55000元之間,表中的數(shù)據(jù)是IT從業(yè)人員年薪的一個樣本:24名IT從業(yè)人員年薪資料表491004860049950488004720049900513505460049300512005100049400514005180049600534004870050300490004980048900486505130051900計算IT從業(yè)人員的平均年薪第12頁,共118頁,2023年,2月20日,星期日2.加權(quán)算術(shù)平均數(shù)

根據(jù)分組整理的數(shù)據(jù)計算的算術(shù)平均數(shù)。

加權(quán)算術(shù)平均數(shù)的公式

f代表各組變量值出現(xiàn)的頻數(shù)。第13頁,共118頁,2023年,2月20日,星期日設(shè)某廠職工按日產(chǎn)量分組后所得組距數(shù)列如下,據(jù)此求平均日產(chǎn)量。按日產(chǎn)量分組(千克)工人數(shù)f(人)60以下1060–701970–805080–903690–10027100–11014110以上8合計164例2組中值X(千克)Xf555506512357537508530609525651051470115920-13550第14頁,共118頁,2023年,2月20日,星期日(1)算術(shù)平均數(shù)的大小,不僅取決于研究對象的變量值(x),而且受各變量值重復(fù)出現(xiàn)的頻數(shù)(f)或頻率(f/∑f)大小的影響,頻數(shù)或頻率較大,該組數(shù)據(jù)的大小對算術(shù)平均數(shù)的影響就大,反之則小。(2)權(quán)數(shù)的表現(xiàn)形式問題注意點第15頁,共118頁,2023年,2月20日,星期日按日產(chǎn)量分組(千克)組中值X(千克)工人數(shù)f(人)ff/∑f60以下55100.063.360–7065190.127.870–8075500.3022.580–9085360.2218.790–10095270.1615.2100–110105140.099.45110以上11580.055.75合計-1641.0082.7例3:第16頁,共118頁,2023年,2月20日,星期日3.算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)

(1)各變量值與其算術(shù)平均數(shù)的離差之和等于零.(2)各變量值與其算術(shù)平均數(shù)的離差平方和最小.

(3)兩個獨立的同性質(zhì)變量代數(shù)和的平均數(shù)等于各變量平均數(shù)的代數(shù)和.(4)兩個獨立的同性質(zhì)變量乘積的平均數(shù)等于各變量平均數(shù)的乘積.第17頁,共118頁,2023年,2月20日,星期日4.算術(shù)平均數(shù)的優(yōu)缺點優(yōu)點(1)可用于推算總體標志總量。(2)代表性強,在抽樣中具有良好的穩(wěn)定性和可靠性.(3)可以進行代數(shù)運算。

缺點(1)當總體中個別單位標志值特別大或特別小時,會導(dǎo)致算術(shù)平均數(shù)偏大或偏小。(2)當組距數(shù)列有開口組時,組中值有較大假定性。第18頁,共118頁,2023年,2月20日,星期日(二)調(diào)和平均數(shù)小學(xué)四年級的算術(shù)題:一輛小車以每小時80公里的速度從山下開到山頂,又以每小時100公里的速度沿原路返回到山下,問:該車的平均速度。80km/h100km/h鏈接例子:F1比賽時,A車手第一圈時速300公里,第二圈時速340公里,B車手第一圈時速320公里,第二圈時速318。請問:只賽兩圈誰獲勝?第19頁,共118頁,2023年,2月20日,星期日問題的解答:速度=距離/時間,故平均速度=總距離/總時間。推廣:如果該車山下——山頂來回開,n次的速度分別為x1,x2,x3,…,xn,則平均速度就成為:第20頁,共118頁,2023年,2月20日,星期日這一計算方式被定義為“調(diào)和平均數(shù)”(H)。變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),故又稱為倒數(shù)平均數(shù)第21頁,共118頁,2023年,2月20日,星期日1、簡單調(diào)和平均數(shù)(1)作為算術(shù)平均的變形例1:三種不同等級的青菜,每公斤單價分別為2元、4元、5元。每種等級各買1元,則均價是多少?例2:某人在30元/股、50元/股、100元/股的三個不同價位各買進“貴州茅臺”股票6000元,則所持該股票的均價是多少?定義:調(diào)和平均數(shù)是變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。又稱倒數(shù)平均數(shù)。調(diào)和平均通常是作為算術(shù)平均數(shù)的變形來使用的。但一些特殊的領(lǐng)域,如綜合評價,調(diào)和平均卻是一種獨立的統(tǒng)計平均數(shù),有著特定的應(yīng)用價值。第22頁,共118頁,2023年,2月20日,星期日例1等價于:三種等級的青菜單價分別為2元/公斤、4元/公斤、5元/公斤,分別購買0.5公斤、0.25公斤、0.2公斤,要求計算平均價格。等價的計算方式是:例2等價于:A股票30元/股時買了200股,50元/股時買了120股,100元/股時買了60股。要求計算股票均價。等價的計算方式是:第23頁,共118頁,2023年,2月20日,星期日(2)作為獨立公式運用例1:計算1與2的調(diào)和平均。例2:編制價格總指數(shù)時,代表品1的價格指數(shù)是110%,代表品2的價格指數(shù)是105%,則可用兩者的調(diào)和平均值作為這一小類的價格指數(shù)。例3:甲員工的“德”、“才”、“能”測量分值分別是90分、86分、84分;乙員工的“德”、“才”、“能”測量分值分別為84分、98分、78分。要求采用簡單調(diào)和平均方法計算并比較甲、乙兩人的綜合素質(zhì)。第24頁,共118頁,2023年,2月20日,星期日第25頁,共118頁,2023年,2月20日,星期日2、加權(quán)調(diào)和平均數(shù)例1:法拉利隊的車王邁克爾·舒馬赫在2004年9月初的一次試車中(F2004),以每小時320公里的速度開了52圈,以每小時345公里的速度開了35圈,而隊友巴里切羅以每小時322公里的速度開了45圈,以每小時337公里的速度開了42圈,求兩人各自的平均車速。例2:三種不同等級的青菜分別買5元、6元、10元,每公斤單價分別為2元、4元、5元,則平均價格是多少?第26頁,共118頁,2023年,2月20日,星期日(1)加權(quán)調(diào)和平均數(shù)的基本公式

(2)加權(quán)調(diào)和平均公式的應(yīng)用

——作為算術(shù)平均的變形當mi=xifi

時,有:第27頁,共118頁,2023年,2月20日,星期日(3)加權(quán)調(diào)和平均公式應(yīng)該注意的幾個問題A.與加權(quán)算術(shù)平均公式類似,加權(quán)調(diào)和平均公式的權(quán)數(shù)也有兩種類型:絕對權(quán)重與比重權(quán)重,相應(yīng)就有兩種不同形式的加權(quán)方式.調(diào)和平均數(shù)的權(quán)數(shù)不是“次數(shù)”而是各組的標志值。絕對權(quán)重比重權(quán)重第28頁,共118頁,2023年,2月20日,星期日B.計算加權(quán)調(diào)和平均值時,同樣需要注意選擇合適的x,以及合適的權(quán)重m.

應(yīng)該以組平均作為x,若無,則用組中值近似代表。權(quán)重m應(yīng)該是具有實際意義的“各組標志總量”。C.調(diào)和平均與算術(shù)平均的正確選擇問題

作為算術(shù)平均數(shù)變形,調(diào)和平均數(shù)主要用于“平均數(shù)的平均”與“相對數(shù)的平均”計算之中。如果掌握了變量值,以及該變量的分子資料時,需要通過基本數(shù)量關(guān)系推導(dǎo)出分母數(shù)值,此時即為“加權(quán)調(diào)和平均”。第29頁,共118頁,2023年,2月20日,星期日甲乙兩農(nóng)貿(mào)市場三種農(nóng)產(chǎn)品的價格和成交量和成交額如下:產(chǎn)品價格甲市場成交額乙市場成交量(元/斤)(萬元)(萬斤)A1.21.22B1.42.81C1.51.51分別求兩個市場農(nóng)產(chǎn)品的平均價格。第30頁,共118頁,2023年,2月20日,星期日這是以分母為權(quán)重的加權(quán)算術(shù)平均數(shù)這是以分子為權(quán)重的加權(quán)調(diào)和平均數(shù)第31頁,共118頁,2023年,2月20日,星期日D.簡單調(diào)和平均與加權(quán)調(diào)和平均的關(guān)系m1=m2=m3=…=mn=m第32頁,共118頁,2023年,2月20日,星期日調(diào)和平均數(shù)易受極端值的影響,且受極小值的影響比受極大值的影響更大。只要有一個變量值為零,就不能計算調(diào)和平均數(shù)。當組距數(shù)列有開口組時,其組中值即使按相鄰組距計算了,假定性也很大,這時,調(diào)和平均數(shù)的代表性就很不可靠。調(diào)和平均數(shù)應(yīng)用的范圍較小。

E.調(diào)和平均的特點第33頁,共118頁,2023年,2月20日,星期日

某魚攤有兩種鯽魚:大的每公斤18元,小的每公斤12元,并不能還價。一顧客欲各買一條,但提出兩條一起稱,每公斤15元,魚攤主答應(yīng)。問誰占便宜?思考題:第34頁,共118頁,2023年,2月20日,星期日3.由相對數(shù)或平均數(shù)計算平均數(shù)(1)由相對數(shù)計算平均數(shù)例1:設(shè)有某行業(yè)150個企業(yè)的有關(guān)產(chǎn)值和利潤資料如表所示,計算該行業(yè)一、二季度的平均產(chǎn)值利潤率。產(chǎn)值利潤率(%)一季度二季度企業(yè)數(shù)(個)實際產(chǎn)值(萬元)企業(yè)數(shù)(個)實際利潤(萬元)5-103057005071010-20702050080351420-305022500202250合計150487001506474第35頁,共118頁,2023年,2月20日,星期日計算第一季度的平均產(chǎn)值利潤率,應(yīng)該采用實際產(chǎn)值加權(quán),進行算術(shù)平均,即有:計算第二季度的平均產(chǎn)值利潤率,則應(yīng)該采用實際利潤加權(quán),即有:第36頁,共118頁,2023年,2月20日,星期日產(chǎn)值計劃完成程度%)組中值(%)X企業(yè)數(shù)(個)實際產(chǎn)值(萬元)M計劃產(chǎn)值(萬元)M/X80~9085268080090~10095323752500100~110105101806017200110~120115350604400合計-182617524900例2:計算下表企業(yè)的平均計劃完成程度第37頁,共118頁,2023年,2月20日,星期日(2)由平均數(shù)計算平均數(shù)例3:某車間各班組工人的平均勞動生產(chǎn)率和實際工時數(shù)據(jù)如表所示,要求計算車間平均勞動生產(chǎn)率班組平均勞動生產(chǎn)率(件/工時)實際工時(小時)123412162028200320300190合計1000我們掌握的資料是平均數(shù)的母項數(shù)值即實際工時數(shù),因而應(yīng)該以實際工時數(shù)為權(quán)數(shù),采用加權(quán)算術(shù)平均數(shù)的形式來計算平均勞動生產(chǎn)率。第38頁,共118頁,2023年,2月20日,星期日平均勞動生產(chǎn)率(件/工時)實際工時實際產(chǎn)品總量(件)班組1234121620282003203001902400512060005320合計101018840車間平均勞動生產(chǎn)率(件/工時)==第39頁,共118頁,2023年,2月20日,星期日(三)幾何平均數(shù)(GeometricMean)幾何平均數(shù)也稱幾何均值,它是n個變量值乘積的n次方根。適用對象:現(xiàn)象的總比率是若干項變量的乘積,或現(xiàn)象的總發(fā)展速度是各時期發(fā)展速度的連乘積時,計算平均比率或平均發(fā)展速度。1.簡單幾何平均數(shù)

(SimpleGeometricMean)

直接將n項變量連乘,對其連乘積開n次方根所得的平均數(shù)即為簡單幾何平均數(shù)。計算公式為:第40頁,共118頁,2023年,2月20日,星期日例1:某企業(yè)的一條生產(chǎn)流水線有四道工序,每一道工序完成的產(chǎn)品都要作一次質(zhì)量檢查,只有合格的中間件才進入下一道工序。工序C工序A工序B工序D合格率98%合格率97%合格率94%合格率95%請問:平均合格率=?第41頁,共118頁,2023年,2月20日,星期日所謂平均“合格率”,是指每一道工序合格率是相同的。這也就是說,如果記“平均合格率為G,則只有”四道工序全部合格的產(chǎn)品才是合格的,因而,有以下等式:第42頁,共118頁,2023年,2月20日,星期日例2:據(jù)網(wǎng)上報到,成都溫江的蘭花節(jié)(2006年2月27日,溫江第三屆蘭花節(jié))上,一盆蘭花賣價是1100萬元,這背后是迅速壯大的10萬戶成都養(yǎng)蘭、炒蘭戶。他們當中,不少人是在借高利貸炒蘭,圖謀暴利。專家稱,成都蘭市價格已漲到了瘋狂的境地,投資蘭花不能盲目跟風(fēng),“擊鼓傳花”式的投機最終會讓人血本無歸。紅荷黃金海岸龍女彩蝶第43頁,共118頁,2023年,2月20日,星期日設(shè)某炒蘭投資者從朋友處借得一筆高利貸,以季度為結(jié)算單位,每個季度生成的利息到期自動轉(zhuǎn)為本金,一年連本帶利付清。各季利率根據(jù)蘭花價格變化適當調(diào)整。實際一年下來,第一季度的利率是3%,第二季度的利率是3.2%,第三季度的利率是3.6%,第四季度的利率是2.8%。問:平均利率是多少?解答:即若借款總額為L萬元,則一年之后的付款額(本息和)為:如果平均利率為G,則應(yīng)該有:第44頁,共118頁,2023年,2月20日,星期日2.加權(quán)幾何平均數(shù)

(WeightedGeometricMean)

與算術(shù)平均數(shù)一樣,當資料中的某些變量值重復(fù)出現(xiàn)時,相應(yīng)地,簡單幾何平均數(shù)就變成了加權(quán)幾何平均數(shù)。計算公式為:第45頁,共118頁,2023年,2月20日,星期日

例3:投資銀行某筆投資的年利率是按復(fù)利計算的,25年的年利率分配是:有1年為3%,有4年為5%,有8年為8%,有10年為10%,有2年為15%,求平均年利率。本利率(%)X年數(shù)f本利率的對數(shù)lgXf·lgX10312.01282.012810542.02128.084810882.033416.2672110102.041420.414011522.06074.1214合計25-50.9002第46頁,共118頁,2023年,2月20日,星期日

25年的平均本利率為108.6%,年平均利率即為8.6%。例4:設(shè)某生產(chǎn)流水線由12道工序組成,據(jù)統(tǒng)計,有3道工序的不合格率為2%,有4道工序的不合格率為4%,有5道工序的不合格率為5%,求平均不合格率第47頁,共118頁,2023年,2月20日,星期日幾何平均數(shù)特點(1)受極端值的影響較算術(shù)平均數(shù)小。(2)如果變量值有負值,計算出的幾何平均數(shù)就會成為負數(shù)或虛數(shù)。(3)僅適用于具有等比或近似等比關(guān)系的數(shù)據(jù)。(4)其對數(shù)是各變量值對數(shù)的算術(shù)平均數(shù)。第48頁,共118頁,2023年,2月20日,星期日(四)幾何平均數(shù)、算術(shù)平均數(shù)和調(diào)和平均數(shù)的關(guān)系冪平均函數(shù)第49頁,共118頁,2023年,2月20日,星期日某公司所屬三個企業(yè)有關(guān)生產(chǎn)資料如下:(1)若三個企業(yè)生產(chǎn)同一種產(chǎn)品,試計算平均合格率(2)若三個企業(yè)生產(chǎn)不同一種產(chǎn)品,試計算平均合格率(3)若三個企業(yè)為流水作業(yè)生產(chǎn)同一種產(chǎn)品,試計算平均合格率企業(yè)合格率(%)產(chǎn)品產(chǎn)量(件)實際消耗工時(工時)甲96100500乙95200450丙98300400思考題:第50頁,共118頁,2023年,2月20日,星期日三、位置平均數(shù)

位置平均數(shù),就是根據(jù)總體中處于特殊位置上的個別單位或部分單位的標志值來確定的代表值,它對于整個總體來說,具有非常直觀的代表性,因此,常用來反映分布的集中趨勢。常用的眾數(shù)、中位數(shù)。第51頁,共118頁,2023年,2月20日,星期日(一)中位數(shù)與分位數(shù)1.中位數(shù)(Median)的含義中位數(shù)是將數(shù)據(jù)按大小順序排列起來,形成一個數(shù)列,居于數(shù)列中間位置的那個數(shù)據(jù)就是中位數(shù)。中位數(shù)用Me表示。Me50%50%在一個等差數(shù)列或一個正態(tài)分布數(shù)列中,中位數(shù)就等于算術(shù)平均數(shù)。第52頁,共118頁,2023年,2月20日,星期日2.中位數(shù)的計算確定中位數(shù),必須將總體各單位的標志值按大小順序排列,最好是編制出變量數(shù)列。這里有兩種情況:A.對于未分組的原始資料,首先必須將標志值按大小排序。設(shè)排序的結(jié)果為:第53頁,共118頁,2023年,2月20日,星期日491004860049950488004720049900513505460049300512005100049400514005180049600534004870050300490004980048900486505130051900例1:24名IT從業(yè)人員年薪資料表如下所示,計算該24名IT人員的中位數(shù)排序得:中位數(shù)的位置在(24+1)/2=12.5,中位數(shù)在第12個數(shù)值(49800)和第13個數(shù)值(49900)之間,即

Me=(49800+49900)/2=49850(元)。第54頁,共118頁,2023年,2月20日,星期日B.由分組資料確定中位數(shù)(1)由單項數(shù)列確定中位數(shù),直接按的公式求出中位數(shù)所在組的位置,計算累計次數(shù)確定中位數(shù)所在的組,組值即是中位數(shù)。第55頁,共118頁,2023年,2月20日,星期日例2:某車間50名工人日加工零件數(shù)分組表零件數(shù)(個)頻數(shù)(人)零件數(shù)(個)頻數(shù)(人)零件數(shù)(個)頻數(shù)(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112第56頁,共118頁,2023年,2月20日,星期日第57頁,共118頁,2023年,2月20日,星期日(2)由組距數(shù)列確定中位數(shù),應(yīng)先按的公式求出中位數(shù)所在組的位置,然后再按下限公式或上限公式確定中位數(shù)。Sm-1-中位數(shù)所在組以下的累計次數(shù)。Sm-1-中位數(shù)所在組以上的累計次數(shù)。第58頁,共118頁,2023年,2月20日,星期日LU第59頁,共118頁,2023年,2月20日,星期日

例3:某企業(yè)50名工人加工零件中位數(shù)計算表,計算50名工人日加工零件數(shù)的中位數(shù)按零件數(shù)分組(個)頻數(shù)(人)向上累計(人)向下累計(人)105~1103350110~1155847115~12081642120~125143034125~1301040201301404504Sm-1Sm+1第60頁,共118頁,2023年,2月20日,星期日中位數(shù)特點(1)中位數(shù)是以它在所有標志值中所處的位置確定的全體單位標志值的代表值,不受分布數(shù)列的極大或極小值影響,從而在一定程度上提高了中位數(shù)對分布數(shù)列的代表性。(2)有些離散型變量的單項式數(shù)列,當次數(shù)分布偏態(tài)時,中位數(shù)的代表性會受到影響。(3)缺乏敏感性。

第61頁,共118頁,2023年,2月20日,星期日2.分位數(shù)分位數(shù)是將變量的數(shù)值按大小順序排列并等分為若干部分后,處于等分點位置的數(shù)值。常用的分位數(shù)有四分位數(shù)、十分位數(shù)和百分位數(shù)根據(jù)中位數(shù)的原理,你能寫出四分位數(shù)的公式嗎?第62頁,共118頁,2023年,2月20日,星期日第63頁,共118頁,2023年,2月20日,星期日(二)眾數(shù)(Mode)1.眾數(shù)的含義眾數(shù)是指總體中出現(xiàn)次數(shù)最多的那個標志值。用Mo表示。它主要用于定類(品質(zhì)標志)數(shù)據(jù)的集中趨勢,當然也適用于作為定序(品質(zhì)標志)數(shù)據(jù)以及定距和定比(數(shù)量標志)數(shù)據(jù)集中趨勢的測度值。眾數(shù)也不受數(shù)列中極端變量值的影響,它可反映總體各單位某一標志值的集中趨勢。第64頁,共118頁,2023年,2月20日,星期日2.眾數(shù)的計算(眾數(shù)的不唯一性)無眾數(shù)

原始數(shù)據(jù):

10591268一個眾數(shù)

原始數(shù)據(jù):

659855多于一個眾數(shù)

原始數(shù)據(jù):

252828

364242第65頁,共118頁,2023年,2月20日,星期日(1)數(shù)值型分組數(shù)據(jù)的眾數(shù)A.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)D.該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布B.相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)MoC.相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMoMoMo第66頁,共118頁,2023年,2月20日,星期日UdLab第67頁,共118頁,2023年,2月20日,星期日某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—例:根據(jù)表中的數(shù)據(jù),計算50名工人日加工零件數(shù)的眾數(shù)第68頁,共118頁,2023年,2月20日,星期日(2)組距數(shù)列確定眾數(shù)的方法下限公式上限公式第69頁,共118頁,2023年,2月20日,星期日眾數(shù)特點1.眾數(shù)不受分布數(shù)列的極大或極小值的影響.2.當分組數(shù)列沒有任何一組的次數(shù)占多數(shù),而是近似于均勻分布時,則該次數(shù)分配數(shù)列無眾數(shù)。若將無眾數(shù)的分布數(shù)列重新分組或各組頻數(shù)依序合并,又會使分配數(shù)列再現(xiàn)出明顯的集中趨勢。第70頁,共118頁,2023年,2月20日,星期日3.如果與眾數(shù)組相比鄰的上下兩組的次數(shù)相等,則眾數(shù)組的組中值就是眾數(shù)值;如果與眾數(shù)組比鄰的上一組的次數(shù)較多,而下一組的次數(shù)較少,則眾數(shù)在眾數(shù)組內(nèi)會偏向該組下限;如果與眾數(shù)組比鄰的上一組的次數(shù)較少,而下一組的次數(shù)較多,則眾數(shù)在眾數(shù)組內(nèi)會偏向該組上限。4.缺乏敏感性。這是由于眾數(shù)的計算只利用了眾數(shù)組的數(shù)據(jù)信息,不象數(shù)值平均數(shù)那樣利用了全部數(shù)據(jù)信息。第71頁,共118頁,2023年,2月20日,星期日(三)中位數(shù)、眾數(shù)和算術(shù)平均數(shù)的關(guān)系在對稱分布(即正態(tài))時在右偏時在左偏時適度偏態(tài)時眾數(shù)與算術(shù)平均數(shù)的距離約為中位數(shù)與算術(shù)平均數(shù)距離的3倍第72頁,共118頁,2023年,2月20日,星期日對稱分布右偏分布左偏分布第73頁,共118頁,2023年,2月20日,星期日一組工人的月收入眾數(shù)為700元,月收入的算術(shù)平均數(shù)為1000元,則月收入的中位數(shù)近似值是:例:第74頁,共118頁,2023年,2月20日,星期日第二節(jié)離中趨勢的描述一、離中趨勢和離散指標

離中趨勢,就是變量分布中各變量值背離中心值的傾向。如果說集中趨勢是總體或變量分布同質(zhì)性的體現(xiàn),那么離中趨勢就是總體或變量分布變異性的體現(xiàn)。離散指標就是反映變量值變動范圍和差異程度的指標,即反映變量分布中各變量值遠離中心值或代表值程度的指標,亦稱為變異指標或標志變動度指標。

第75頁,共118頁,2023年,2月20日,星期日離散指標是衡量平均指標代表性的尺度。一般來講,數(shù)據(jù)分布越分散,變異指標越大,平均指標的代表性越??;數(shù)據(jù)分布越集中,變異指標越小,平均指標的代表性越大。常用的變異指標有:全距、平均差、方差和標準差、變異系數(shù)。

第76頁,共118頁,2023年,2月20日,星期日離散指標的作用

用離散指標衡量和比較平均指標的代表性。用離散指標反映經(jīng)濟活動過程的均衡性、穩(wěn)定性和節(jié)奏性。離散指標為統(tǒng)計推斷提供依據(jù)。第77頁,共118頁,2023年,2月20日,星期日接吻定律

第一次接吻以后,女人會把這個吻當作一筆放出去的投資,男人卻會把它當做一筆收回來的貸款。樂觀與悲觀定律

樂觀者發(fā)明了游艇,悲觀者發(fā)明了救生圈;樂觀者建造了高樓,悲觀者生產(chǎn)了救火栓;樂觀者都去做了玩命的賽車手,悲觀者卻穿起了白大褂當了醫(yī)生;最后樂觀者發(fā)射了宇宙飛船,悲觀者則開辦了保險公司。人力定律

一個人在一分鐘內(nèi)可以挖一個洞,六十個人在一秒鐘內(nèi)就辦不到。做飯定律

因為怕做飯,男人下了班也不忙著回家;因為要做飯,女人沒下班就忙著溜回家。第78頁,共118頁,2023年,2月20日,星期日二、離散指標的測度(一)全距(Range)全距(R)也稱為極差,是指總體各單位的兩個極端標志值之差,即:R=最大標志值-最小標志值

特點(優(yōu)點與缺點)(1)簡明;(2)只反映變異范圍;(3)只受兩個數(shù)值影響;最容易受極端值影響。沒有反映中間數(shù)值的影響,沒有反映分布情況。第79頁,共118頁,2023年,2月20日,星期日例1:有兩個學(xué)習(xí)小組的統(tǒng)計學(xué)開始成績分別為:第一組:60,70,80,90,100第二組:78,79,80,81,82很明顯,兩個小組的考試成績平均分都是80分,但是哪一組的分數(shù)比較集中呢?如果用全距指標來衡量,則有R甲=100-60=40(分)R乙=82-78=4(分)這說明第一組資料的標志變動度或離中趨勢遠大于第二組資料的標志變動度。第80頁,共118頁,2023年,2月20日,星期日(二)四分位差四分位差是四分位數(shù)中第一個四分位數(shù)與第三個四分位數(shù)之差,也稱為內(nèi)距或四分間距,通常用表示,即:第81頁,共118頁,2023年,2月20日,星期日(三)異眾比率異眾比率是分布數(shù)列中非眾數(shù)組的頻數(shù)與總頻數(shù)之比,通常用來表示,即:

第82頁,共118頁,2023年,2月20日,星期日在資料未分組的情況下,平均差的計算公式為:

在資料已分組的情況下,要用加權(quán)平均差公式:

第83頁,共118頁,2023年,2月20日,星期日例2:某廠按月收入水平分組的組距數(shù)列如表所示,計算平均差

例1:以甲組學(xué)生數(shù)學(xué)成績?yōu)槔骄钊缦拢篈.D=職工工資(元)職工人數(shù)(f)250-27015270-29025290-31035310-33065330-35040合計180組中值(x)xfx-2603900-507502807000-3075030010500-10350320208001065034013600301200-55800-3700第84頁,共118頁,2023年,2月20日,星期日解:根據(jù)公式列表計算,得到A.D=

由于平均差采用了離差的絕對值,不便于運算,這樣使其應(yīng)用受到了很大限制。第85頁,共118頁,2023年,2月20日,星期日(四)平均差(MeanDeviation)

平均差是總體各單位標志值對其算術(shù)平均數(shù)的離差絕對值的算術(shù)平均數(shù)。特點(1)反映了全部標志值的變動情況;(2)受平均數(shù)水平高低、計量單位(不同性質(zhì)的現(xiàn)象)影響;(3)取絕對值的方法消除離差正負號,不便于代數(shù)處理。第86頁,共118頁,2023年,2月20日,星期日(五)方差(Variance)、

標準差(StandardDeviation)

方差和標準差是測度數(shù)據(jù)變異程度的最重要、最常用的指標。方差是各個數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方的平均數(shù),通常以σ2表示。標準差又稱均方差,一般用σ表示。方差和標準差的計算也分為簡單平均法和加權(quán)平均法,另外,對于總體數(shù)據(jù)和樣本數(shù)據(jù),公式略有不同。第87頁,共118頁,2023年,2月20日,星期日1.總體方差和標準差

設(shè)總體方差為,對于未經(jīng)分組整理的原始數(shù)據(jù),方差的計算公式為:對于分過組的數(shù)據(jù),方差的計算公式為:第88頁,共118頁,2023年,2月20日,星期日方差的平方根即為標準差,其相應(yīng)的計算公式為:未分組數(shù)據(jù):分組數(shù)據(jù):

第89頁,共118頁,2023年,2月20日,星期日2.樣本方差和標準差樣本方差與總體方差在計算上的區(qū)別是:總體方差是用數(shù)據(jù)個數(shù)或總頻數(shù)去除離差平方和,而樣本方差則是用樣本數(shù)據(jù)個數(shù)或總頻數(shù)減1去除離差平方和,其中樣本數(shù)據(jù)個數(shù)減1即n-1稱為自由度。第90頁,共118頁,2023年,2月20日,星期日設(shè)樣本方差為,根據(jù)未分組數(shù)據(jù)和分組數(shù)據(jù)計算樣本方差的公式分別為:未分組數(shù)據(jù):分組數(shù)據(jù):

第91頁,共118頁,2023年,2月20日,星期日根據(jù)未分組數(shù)據(jù)和分組數(shù)據(jù)計算樣本標準差的公式分別為:未分組數(shù)據(jù):分組數(shù)據(jù):

第92頁,共118頁,2023年,2月20日,星期日例1:考察一臺機器的生產(chǎn)能力,利用抽樣程序來檢驗生產(chǎn)出來的產(chǎn)品質(zhì)量,假設(shè)搜集的數(shù)據(jù)如下:根據(jù)該行業(yè)通用法則:如果一個樣本中的14個數(shù)據(jù)項的方差大于0.005,則該機器必須關(guān)閉待修。問此時的機器是否必須關(guān)閉?第93頁,共118頁,2023年,2月20日,星期日解:根據(jù)已知數(shù)據(jù),計算因此,該機器工作正常。第94頁,共118頁,2023年,2月20日,星期日例2:以下是江蘇省和浙江省2005年年營業(yè)收入最大的前15個企業(yè),試用標準差來比較兩省企業(yè)收入的穩(wěn)定程度.江蘇前15名營業(yè)收入(萬元)浙江前15名營業(yè)收入(萬元)江蘇沙鋼集團有限公司3112365浙江物產(chǎn)集團3476937熊貓電子集團2804390浙江省興合集團2261710南京鋼鐵集團2788062浙江冶金集團2159445江蘇華西集團公司2603864廣廈控股創(chuàng)業(yè)投資有限公司2137266蘇寧電器集團2246465萬向集團2092908太平洋建設(shè)集團2122634浙江省能源集團有限公司1838372南京斯威特集團有限公司1960673橫店集團1429810春蘭集團1706942雅戈爾集團1397123徐州工程機械集團有限公司1700551浙江省建設(shè)投資集團1383451華芳集團有限公司1691373正泰集團1196121江蘇悅達集團1538658寧波電子信息集團1194889江蘇國泰國際集團有限公司1206262杭州娃哈哈集團1144323江蘇永鋼集團有限公司1166189德力西集團1076741江蘇交通控股有限公司1118380奧克斯集團1034198躍進汽車集團1113675華立集團1033388第95頁,共118頁,2023年,2月20日,星期日江蘇省:

=1925365.533(萬元)

=667382.6891(萬元)浙江省=1657112.133(萬元)

=675072.0375(萬元)從標準差看江蘇企業(yè)比浙江省企業(yè)的營業(yè)收入穩(wěn)定第96頁,共118頁,2023年,2月20日,星期日營業(yè)收入(億元)企業(yè)個數(shù)(江蘇)(浙江)10-20487520-30262430-4040-5050-6060-7070-8080-9090-100100以上15166878988163111810合計144154例3:以下是江蘇省和浙江省2005年年營業(yè)收入超過10億元企業(yè),試用標準差來比較兩省營業(yè)收入超過10億元企業(yè)收入的穩(wěn)定程度.第97頁,共118頁,2023年,2月20日,星期日江蘇:先計算平均數(shù):=43.26(億元)

標準差

=31.52(億元)浙江:=32.98(億元)=26.07(億元)第98頁,共118頁,2023年,2月20日,星期日在實際計算方差時,可以采用另一種較為簡便的方法:方差和標準差也是根據(jù)全部數(shù)據(jù)計算的,它反映了每個數(shù)據(jù)與其均值相比平均相差的數(shù)值,因此它能準確地反映出數(shù)據(jù)的離散程度。第99頁,共118頁,2023年,2月20日,星期日σ與R的關(guān)系σ與A.D.的關(guān)系經(jīng)驗表明,當分布數(shù)列接近于正態(tài)分布時,R和σ之間存在以下經(jīng)驗公式:R為4至6個σ:當標志值項數(shù)較少時,R≈4σ

當標志值項數(shù)較多時,R≈6σ對同一資料,所求的平均差一般比標準差要小,即A.D.≤σ3.標準差與全距、平均差的關(guān)系第100頁,共118頁,2023年,2月20日,星期日(六)離散系數(shù)(CoefficientofVariation)上面介紹的各離散程度測度值都是反映數(shù)據(jù)分散程度的絕對值,其數(shù)值的大小依賴于兩方面:1.原變量值本身水平高低的影響。2.它們與原變量值的計量單位相同,采用不同計量單位計量的變量值,其離散程度的測度值也就不同。第101頁,共118頁,2023年,2月20日,星期日對于平均水平不同或計量單位不同的不同組別的變量值,是不能直接用上述離散程度的測度值直接進行比較的。為了消除變量值水平高低和計量單位不同對離散程度測度值的影響,需要計算離散系數(shù)。離散系數(shù)也稱為標準差系數(shù),它是一組數(shù)據(jù)的標準差與其相應(yīng)的均值之比,是測度數(shù)據(jù)離散程度的相對指標。第102頁,共118頁,2023年,2月20日,星期日其計算公式為:Vσ和Vs分別表示總體離散系數(shù)和樣本離散系數(shù)。離散系數(shù)要是用于對不同組別數(shù)據(jù)的離散程度進行比較,離散系數(shù)大的說明該組數(shù)據(jù)的離散程度也就大,離散系數(shù)小的說明該組數(shù)據(jù)的離散程度也就小。第103頁,共118頁,2023年,2月20日,星期日例1:甲乙兩個城市的居民年收入情況表中前三欄的數(shù)據(jù)來看,乙城市不僅人均年收入兩倍于甲城市,而且收入的差距也似乎顯著于甲城市.但通過計算標準差系數(shù)可以看出:乙城市的實際收入差距相對于它的平均收入來說,比甲城市要低的多.或者說,以居民對收入收入差距所承受的壓力而言,甲城市要比乙城市高得多.人均年收入收入標準差標準差系數(shù)甲城市60001502.5乙城市120001801.5第104頁,共118頁,2023年,2月20日,星期日例2:江蘇企業(yè)江蘇企業(yè)的經(jīng)營收入比浙江企業(yè)穩(wěn)定浙江企業(yè)例3:火箭隊每場比賽失誤的均值是5.6分,全賽季失誤的標準差是10分,馬刺隊每場比賽失誤的均值是4.2分,全賽季失誤的標準差是10分.你認為以下哪一種敘述是正確的()火箭隊比馬刺隊打球水平差火箭隊比馬刺隊在失誤上比較穩(wěn)定馬刺隊比火箭隊在失誤上比較穩(wěn)定馬刺隊很少不失誤第105頁,共118頁,2023年,2月20日,星期日(七)是非標志的平均數(shù)和標準差

是非標志,又稱交替標志,它是用“是”

“否”或“有”“無”來表示的。由于是非標志只有兩個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論