




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第1章什么是統(tǒng)計學
【學習目標】
?回答初學者最關注的幾個問題。
?通過解讀實例來掌握統(tǒng)計語言。
?通過統(tǒng)計思維來素描本書框架。
?過目不忘數(shù)據(jù)神器的藏身之處。
欣賞留言
左圖:中國郵票。統(tǒng)計學是什么
說明:2015年發(fā)行的郵是一首數(shù)據(jù)之歌
票,主題為“拜年”,紀念中智慧美妙萬世傳唱
國的傳統(tǒng)春節(jié)。清新婉轉歡快活潑
學生和老師的一段對話。
學生:開門大吉,恭喜恭喜!
老師:統(tǒng)計之旅就要開始了,可喜可賀!
學生:要學統(tǒng)計學了,有點小緊張,有點小興奮。
老師:你啊,當年我也一樣。
學生:我知道,統(tǒng)計跟數(shù)據(jù)打交道,嗯,一定要學“統(tǒng)計學原理”嗎?
老師:統(tǒng)引學原理是數(shù)據(jù)基礎,不想成為數(shù)據(jù)的“文盲”,還走系統(tǒng)地學一點比較好。
學生:我想也是。
老師:你的文筆,不錯,有了數(shù)據(jù)的功底,寫起有理有據(jù)的文章,就會妙筆生花。
學生:老師您過獎了,只是學生我現(xiàn)在很少用筆寫字,我喜歡用鍵盤碼字兒。
老師:噢,不管怎么樣,字一定要寫好,不然,情書一出手,就會嚇跑心儀的那位。
學生:瞧您說的。老師放心,學生我記住了,練好字,必須的!
老師:漢字要寫對,要寫好,統(tǒng)計的語言是數(shù)據(jù),數(shù)據(jù)的語言也要寫對,也要寫好。
學生:數(shù)據(jù)的語言?這是哪國的語言?
老師:數(shù)據(jù)語言是國際通用的語言。
學生:12345算不算數(shù)據(jù)語言呢?
老師:當然不算,數(shù)據(jù)語言是有生命的。數(shù)據(jù)的語言有出生日,還有誕生地。
學生:數(shù)據(jù)語言居然還是活的,聽起來好好玩的樣子。數(shù)據(jù)的語言,好不好學呀?
老師:數(shù)據(jù)的語言,好學又好玩,要學就學純正的,我們用實例來學,你會越玩越嗨!
學生:我喜歡愉快地學習。
老師:統(tǒng)計世界風光無限,祝我們旅途愉快!
1.1你來問我來答
第一堂統(tǒng)計課,老師問學生:“你最想問的一個問題是什么?”
下面就是精選出來的5個提問,讓我們在漫談式的一問一答中,輕松步入統(tǒng)計學世界。
(1)問:我們小學和中學都學了統(tǒng)計,為什么到了大學還要學呢?
答:在小學和中學的《數(shù)學》和《信息技術》教材中,如同客串,穿插著介紹了統(tǒng)計
學的基礎知識。到了大學,很多專業(yè)都開設了“統(tǒng)計學原理”這門課,系統(tǒng)而深入地介紹
統(tǒng)計學的知識。
在統(tǒng)計學原理中,系統(tǒng)性表現(xiàn)在整體內容是以統(tǒng)計思維構建的,統(tǒng)計思維就是搜集、
整理、分析和傳播數(shù)據(jù),這也是本書的基本框架。除了系統(tǒng)和全面,學習內容也更深入、
更有趣。
比如,閱讀實例,學會運用規(guī)范的統(tǒng)計語言;敲打鍵盤,輕松算出和畫出數(shù)據(jù);綜合
運用統(tǒng)計方法,展開論證和找出規(guī)律;有效運用統(tǒng)計語言,寫作數(shù)據(jù)文章等。另外,根據(jù)
每章所學,可自行設計題目,自問自答,在自由放飛中,自然會有收獲。
有了統(tǒng)計學的基本原理,不管從事什么行業(yè),都可以用統(tǒng)計的思維看世界。當今社會,
流行招聘,逢進必考,考點中常有統(tǒng)計知識,為什么?這是因為所有領域都離不開數(shù)據(jù),
也就需要掌握統(tǒng)計學的基本原理。
(2)問:統(tǒng)計學最大的魅力是什么?
答:統(tǒng)計學最大的魅力就是從無序的數(shù)據(jù)中找到規(guī)律。這種迷人的魅力,傾倒眾生。
先講一個例子吧。比如,“第一堂統(tǒng)計課,你最想問的一個問題是什么?”同樣的問
題,用寫小紙條的形式,請不同年級和不同專業(yè)的學生回答。有意思的是,把這些問題匯
總起來,統(tǒng)計一下,就發(fā)現(xiàn)了規(guī)律,主要集中在4個方面,即統(tǒng)計學是什么(Who)、為什么
學(Why)、學什么(What)、怎么學(Way)。
再舉兩個例子,高考那段時間,老師總是會統(tǒng)計和研究前幾年的高考試卷來分析出題
方向。上網購物的時候,網站已將瀏覽數(shù)據(jù)保存下來,然后向顧客推薦可能感興趣的商品。
順便再播報兒個好消息。
10月20日的“世界統(tǒng)計日”來了,這是2010年聯(lián)合國大會的決議。
9月20日的“中國統(tǒng)計日”跟著來,這是2010年中國國家統(tǒng)計局的決定。
2019年,在世界一流學科的高校排名中,統(tǒng)計學的學科狀元高校為美國的哈佛大學。
同年,在中國高校一流學科的建設中,統(tǒng)計學在北京大學和清華大學均榜上有名。
(3)問:情感也能量化嗎?
答:當然能?!缎睦斫y(tǒng)計學》早就上架,成為大學里研讀的課本了。
統(tǒng)計學的科目,分為統(tǒng)計學原理和專業(yè)統(tǒng)計學。《心理統(tǒng)計學》屬于專業(yè)統(tǒng)計學,本
書講述的是統(tǒng)計學原理部分,統(tǒng)計學原理是專業(yè)統(tǒng)計學的基礎。
年復一年,每年都有統(tǒng)計學教材新鮮上市,如《國際統(tǒng)計學》《心理統(tǒng)計學》《旅游
統(tǒng)計學》《體育統(tǒng)計學》《傳播統(tǒng)計學》等。
為增加一點觀感,現(xiàn)展示部分統(tǒng)計學教材的封面,如圖1/所示。
實用環(huán)境統(tǒng)計學
圖1-1大學統(tǒng)計學教材的封面
統(tǒng)計學與數(shù)據(jù)打交道,魅力大,用途廣,各個領域都在應用統(tǒng)計學,各大名校都已設
置統(tǒng)計專業(yè)。
如果你發(fā)現(xiàn)所學的專業(yè)或其他方面,還有什么沒被加上統(tǒng)計學后綴的話,那么,恭喜
你,你有了新發(fā)現(xiàn),你要趕快把新發(fā)現(xiàn)變成新成果,寫一本這類的統(tǒng)計學,以填補空白。
(4)問:您能告訴我學統(tǒng)計學的訣竅嗎?
答:成績優(yōu)秀=誠實+自信+勤學勤練+活學活用。這是主旋律,統(tǒng)計學也不走調。
學好統(tǒng)計學的訣竅,可以歸納為兩個詞:總譜、實務。總譜如同圖紙,實務如同施工。
“總譜”就是總框架。用統(tǒng)計思維設計的總框架,即設計一搜集數(shù)據(jù)一整理數(shù)據(jù)一分
析數(shù)據(jù)一傳播數(shù)據(jù)。有了整體把握,心中就有譜,就能一環(huán)緊扣一環(huán),不掉鏈子。從零開
始,循序漸進,不愁學不會。
“實務”就是學以致用。比如,書中有大量實例,可供享用。又如,自己編題做題,
做完題以后,請同學看一看,改一改,留言做紀念。相互之間,取長補短,活學活用,學
業(yè)和友情,同增同長。如此這般,玩中學,學中玩,不愁玩不轉。
學好統(tǒng)計學的訣竅,最關鍵的還是源于興趣。統(tǒng)計學是一門方法論的學科,與數(shù)據(jù)打
交道,要求能寫會算。人們仰慕有才的人,統(tǒng)計學就是一門讓人有才的學問,有了這個動
力,那就出發(fā)吧!
(5)問:請問與本課程相關的,有哪些有趣的網站和書籍?
答:統(tǒng)計與數(shù)據(jù)打交道,數(shù)據(jù)無處不在,智慧之花俯拾皆是。
有趣的統(tǒng)計網站,有個人的網站,也有群體的網站,這里略舉一二。
統(tǒng)計學的個人網站,如韓際平的自媒體,可搜索公眾號“微言小語”;邱東的微博,
可搜索“北師大邱東的微博”;潘瑤的博客,可搜索“panfan的博客”。還有小蚊子樂園、
鄭來軼的博客、公眾號“未一統(tǒng)計”。
統(tǒng)計學的團隊網站,如統(tǒng)計之都、網易數(shù)讀、數(shù)據(jù)分析師,還有統(tǒng)計局、精英統(tǒng)計工
作室、ExcelHOME等。
統(tǒng)計院校的網站,如中國人民大學統(tǒng)計學院、北京師范大學統(tǒng)計學院、北京大學光華
管理學院商務統(tǒng)計與經濟計量系,還有美國哈佛大學統(tǒng)計系、英國牛津大學統(tǒng)計系、德國
慕尼黑大學統(tǒng)計學院等。
部分統(tǒng)計網站的截圖,如圖1-2所示。
中匈人民大屋統(tǒng)計學院
新聞河易=再蓼底=方
/ggiMnurnnBCWMIKMOOLorHAWKS
網數(shù)讀
SchoolofSun*lic?.licijingNormall'nivcr%ity
韓際平的自媒體用氣褥說竟.提供輕運化的
霸斯4耐心經濟討■事
數(shù)猴分析師
C、.■l)ACERTIFIEDDATAA'ULYST
智HARVARDUNIVERSITY
l'I、I'.J...
IVKSSlMb4?K*|ltV?I'0
邱東的微博潘瑞的博客DepartmentofStatistics
圖1-2統(tǒng)計學的網站截圖
有趣的統(tǒng)計科普讀物:《數(shù)海臨風》《愛上統(tǒng)計學》《統(tǒng)計學的世界》《生活中的統(tǒng)
計學》《統(tǒng)計使人更聰明》《統(tǒng)計連著我和你》。這些書的封面,請欣賞圖l-3o
?-------廣?——
圖1-3統(tǒng)計科普讀物的封面
統(tǒng)計學,趣味十足,鮮活靈動,人見人愛,只要肯學,不愁學不好,只愁太癡迷。帶
著一顆自由和快樂的心,來赴統(tǒng)計學的盛宴,自然會樂在其中。
統(tǒng)計學跟數(shù)據(jù)打交道,統(tǒng)計的語言是數(shù)據(jù)。統(tǒng)計、統(tǒng)計學、數(shù)據(jù)這三者,統(tǒng)計和統(tǒng)計
學是什么意思,統(tǒng)計學一路走來有什么小故事,規(guī)范的統(tǒng)計語言是怎樣的,下文自有分解。
1.2統(tǒng)計和統(tǒng)計學
1.統(tǒng)計和統(tǒng)計學的含義
統(tǒng)計是指調查和研究數(shù)據(jù)的統(tǒng)一體。統(tǒng)計學是一門關于數(shù)據(jù)的學問。
“統(tǒng)計”一詞有動詞和名詞之分。
有人說:“把這個給統(tǒng)計一下?!边@里說的“統(tǒng)計”是動詞,表示“算一算”。
有人講:“我學的是統(tǒng)計專業(yè)。”這里說的“統(tǒng)計”是名詞,表示“統(tǒng)計領域的學問”。
從動詞看,統(tǒng)計是指調查數(shù)據(jù)的實踐;從名詞看,統(tǒng)計是指研究數(shù)據(jù)的統(tǒng)計學;從調
查和研究的結果看,統(tǒng)計是指數(shù)據(jù)。
統(tǒng)計數(shù)據(jù)簡稱“數(shù)據(jù)”。
數(shù)據(jù)是指用科學方法,對研究對象進行量化,用獲取的信息認識研究對象。
數(shù)據(jù)的主要特點是真實、準確、完整和及時,這也是統(tǒng)計調查研究活動的靈魂。真實
的數(shù)據(jù),還必須準確、完整和及時提供,只有這樣,才能有效地進行研判。從優(yōu)質數(shù)據(jù)中
提取有用的信息,這是統(tǒng)計的價值所在,信息職能也是統(tǒng)計最基本的職能。
數(shù)據(jù)從廣義看,包括數(shù)據(jù)的名稱和數(shù)值。數(shù)據(jù)從狹義看,只指數(shù)值。
廣義上的數(shù)據(jù),稱為“變量”,如數(shù)值型數(shù)據(jù)又可稱為“數(shù)值型變量”。變量包括變
量的名稱和數(shù)值,變量的取值稱為“變量值”。
由于研究對象的不同、采集數(shù)據(jù)角度的不同,得到的數(shù)據(jù)也不一樣。對這些數(shù)據(jù)進行
分類,把握各類數(shù)據(jù)的風格,可以更好地認識研究對象。
大數(shù)據(jù)是指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,
是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力,并且呈現(xiàn)海量、
高增長率和多樣化的信息資產。
大數(shù)據(jù)具有5個特點,即5V特點:大量性(Volume)、多樣性(Variety)、高速性(Velocity)、
價值性(Value)、真實性(Veracity)。
?大量性是指數(shù)據(jù)量大,包括采集、存儲和計算的數(shù)據(jù)量都非常大。
?多樣性是指數(shù)據(jù)類型多樣化,包括文字、圖片、音頻、視頻等。
?高速性是指數(shù)據(jù)的增長速度快,處理速度也快,時效性要求高。
?價值性是指數(shù)據(jù)分散,但經挖掘后,數(shù)據(jù)的價值高。
?真實性是指數(shù)據(jù)的質量,包括數(shù)據(jù)的準確性和可信賴度。
大數(shù)據(jù)運用很廣,如利用大數(shù)據(jù)助力城市交通,通過對路段、車輛、時間和空間等進
行大數(shù)據(jù)分析,可用電子屏對路況進行實時性可視化呈現(xiàn)。
統(tǒng)計是統(tǒng)計實踐、統(tǒng)計學和統(tǒng)計數(shù)據(jù)的統(tǒng)一體。這三者的關系密不可分,統(tǒng)計學與統(tǒng)
計實踐是理論與實踐的關系,兩者都離不開數(shù)據(jù)。數(shù)據(jù)是統(tǒng)計實踐的成果,是統(tǒng)計學研究
的依據(jù)。離開數(shù)據(jù),統(tǒng)計就成了無源之水。
統(tǒng)計學和統(tǒng)計數(shù)據(jù)的親密關系,還可以從英文單詞中略見一斑。“statistics”這個英文
心詞,單數(shù)形式表示“統(tǒng)計學”,復數(shù)形式表示“統(tǒng)計數(shù)據(jù)”。
關于統(tǒng)計學的定義,有很多版本。
版本一,統(tǒng)計學是一門搜集、分析、表述和解釋數(shù)據(jù)的科學和藝術。(英國《不列顛百
科全書》的定義)
版本二,統(tǒng)計學是一門研究數(shù)據(jù)的科學,任務是有效地搜集、整理和分析這些數(shù)據(jù),
探索數(shù)據(jù)內在的數(shù)量規(guī)律性,為決策提供依據(jù)。(中國統(tǒng)計師職業(yè)考試書的定義)
版本三,統(tǒng)計學是一門搜集、整理、分析和傳播數(shù)據(jù)的科學和藝術,目的是通過數(shù)據(jù)
分析,揭示研究對象的統(tǒng)計特征和規(guī)律。(本書的定義)
對統(tǒng)計學定義的解讀:統(tǒng)計學是一門專注于用數(shù)據(jù)語言來認識世界的學問。一般來講,
數(shù)據(jù)的獲得要經過調查研究,即確定研究對象,圍繞預定目標,搜集數(shù)據(jù),把搜集到的散
亂數(shù)據(jù)整理為有條理的數(shù)據(jù),從數(shù)量方面探尋研究對象的數(shù)量特征和統(tǒng)計規(guī)律,結合數(shù)據(jù)
成果和相關信息進行判斷,并選擇適當?shù)姆绞竭M行傳播。
比如,人口性別的統(tǒng)計規(guī)律顯示,男嬰和女嬰的性別比為1()5:1()(),嬰幼兒時的男性
略多于女性,中青年時的男女人數(shù)大致持平,老年時的女性又略多于男性。
統(tǒng)計學的特點是數(shù)量性、科學性和藝術性。
統(tǒng)計學最大的特點是數(shù)量性。數(shù)據(jù)是主角,統(tǒng)計學不管走到哪里,都要用數(shù)據(jù)說話。
統(tǒng)計學、數(shù)學、計算機科學和經濟學,都與數(shù)據(jù)打交道,但又各具特色。
(1)統(tǒng)計學與數(shù)學相比,從研究對象來看,統(tǒng)計學與真實的數(shù)據(jù)打交道,數(shù)學主要與
抽象的數(shù)字打交道;從研究方法來看,統(tǒng)計學主要運用歸納的方法,數(shù)學主要運用邏輯推
證的方法。
(2)統(tǒng)計學與計算機科學相比,統(tǒng)計學是研究數(shù)據(jù)的方法論學科,計算機科學是計算
數(shù)據(jù)的技術工具。
(3)統(tǒng)計學與經濟學相比,從研究范圍來看,統(tǒng)計學比經濟學研究的范圍更廣,統(tǒng)計
數(shù)據(jù)既包括經濟數(shù)據(jù),也包括其他各類數(shù)據(jù);從研究方法來看,經濟學研究往往要借助統(tǒng)
計學方法。
統(tǒng)計學往往助力學者摘取諾貝爾經濟學獎的桂冠。翻閱諾貝爾經濟學獎得主的故事,
發(fā)現(xiàn)他們都有數(shù)據(jù)的情結,都善于運用統(tǒng)計學方法,現(xiàn)摘錄部分資料,分享如下。
1969年,首屆諾貝爾經濟學獎得主因“主要從事于把統(tǒng)計應用于動態(tài)經濟理論”而獲
獎。獲獎者丁伯根為荷蘭中央統(tǒng)計局商業(yè)循環(huán)研究的統(tǒng)計學家。
1970年,薩繆爾森榮獲諾貝爾經濟學獎。他所著的《經濟學》教材風靡全球,他也是
將數(shù)學和統(tǒng)計分析方法引入經濟學的第一人。他認為,“在許多與經濟學有關的學科中,
統(tǒng)計學特別重要”。
1980年,獲獎者克萊因是計量經濟學的創(chuàng)始人,被稱為“計量經濟學之父”。
1990年,獲獎者夏普等3人“在金融經濟學方面做出了開創(chuàng)性的工作”。
2000年,獲獎者麥克法登和赫克曼因“對抽樣的原理和方法所做出的發(fā)展和貢獻”而
獲此殊榮。
201()年,獲獎者戴夢得等3人憑借“對經濟政策如何影響失業(yè)率理論的進一步分析”
而摘得桂冠。
2015年,諾貝爾經濟學獎得主辿頓因“對消費、貧困與福利的分析”和著作《家庭調
查分析》而獲此殊榮。迪頓在劍橋大學時深受1984年諾貝爾經濟學獎獲得者斯通的影響。
斯通認為“計量經濟學包括兩部分,測度和統(tǒng)計,二者缺一不可”。
2016年,諾貝爾經濟學獎的兩位得主哈特和霍姆斯特羅姆因“對契約安排最優(yōu)化的
分析”而獲獎。他們都是美國計量經濟學會的會員,其中一位曾擔任美國計量經濟學會的
主席。
2017年,諾貝爾經濟學獎得主塞勒的貢獻在于“為個人決策的經濟和心理分析之間搭
建了一座橋梁”。
2018年,諾貝爾經濟學獎得主諾德豪斯和羅默的獲獎理由是“創(chuàng)新、氣候和經濟增長
的研究”。
統(tǒng)計學是科學性和藝術性的完美統(tǒng)一。
統(tǒng)計學是數(shù)據(jù)科學,統(tǒng)計學的科學性是內容,統(tǒng)計學的藝術性是形式,兩者是內容
與形式的關系。統(tǒng)計學的藝術性,是在遵循數(shù)據(jù)科學性的前提下,用藝術形式表達和傳播
數(shù)據(jù)。
比如,統(tǒng)計學的一大獨門絕技,就是用藝術化的圖表呈現(xiàn)數(shù)據(jù),讓人感受到數(shù)據(jù)之美。
可視化圖表的流行,就是藝術化呈現(xiàn)數(shù)據(jù)的一例。
統(tǒng)計學最大的魅力是從數(shù)據(jù)中找到研究對象的數(shù)量特征和內在規(guī)律。心中有數(shù),就能
更有效地進行判斷和決策。
統(tǒng)計學的生命力在于統(tǒng)計思維,即搜集、整理、分析和傳播數(shù)據(jù)。在傳播數(shù)據(jù)時,特
別要留意傳播的范圍,涉及個人隱私和國家機密等的數(shù)據(jù),不能公開傳播。
從“算一算”的統(tǒng)計到形成統(tǒng)計學,其間經歷了很多年。沒有統(tǒng)計的實踐活動,就沒
有統(tǒng)計學這門學科。
2.統(tǒng)計實踐簡史
最初的統(tǒng)計出現(xiàn)在原始社會,人們?yōu)榱俗罨镜纳嫘枰?,用刻線、打繩結等方式來計數(shù)。
統(tǒng)計實踐的真正萌芽是在奴隸社會,統(tǒng)治者為了對內統(tǒng)治和對外戰(zhàn)爭,需要征兵和征
稅,于是就有了人口、土地和糧食的統(tǒng)計。
從四大文明古國來看,可以看出各國的發(fā)展與統(tǒng)計實踐的親密關系。
(1)古印度建立了人口登記制度。
(2)古巴比倫統(tǒng)一了測地工具與單位長度。
(3)古埃及為了建造金字塔,進行了全國人口和財產的調查。
(4)古代中國有了最早的統(tǒng)計數(shù)據(jù)。公元前2000多年的夏朝,全國分為九州,人口人,
土地頃。春秋戰(zhàn)國時代,出現(xiàn)了統(tǒng)計學的真知灼見。例如,素有“華夏第一相”之稱的管
仲(約公元前723—公元前645)在他所著的《管子》中指出:“不明于計數(shù)而欲舉大事,猶
無舟楫而欲經于水險也?!边@句古話翻譯成白話,意思為:“不了解計數(shù)而想要舉辦大事,
就好比沒有舟楫想渡過危險水域一樣。”
統(tǒng)計實踐的初步發(fā)展是在封建社會,其主要特點是注重編制財產目錄,同時統(tǒng)計著述
開始出現(xiàn)。隨著人類社會生產的發(fā)展,統(tǒng)計的范圍逐漸由人口、土地、糧食發(fā)展到社會經
濟生活的各個方面。
法國在9世紀的查理大帝時代,編制了《國庫財產大綱》,內容包括對人口、土地、
收入、農產品、畜產品和工業(yè)品的調查結果。
英國在11世紀的威廉時代,編制了《最終稅冊》,內容包括對土地土和自由民的土地
占有情況和市民的財產情況的調查結果。
在封建社會,自給自足的自然經濟占主導地位,生產力低下,經濟落后,封建生產關
系阻礙了社會生產力的發(fā)展,相應地也阻礙了統(tǒng)計實踐的發(fā)展。
統(tǒng)計實踐的全面發(fā)展始于資本主義社會,其主要特點是統(tǒng)計法規(guī)制度化、統(tǒng)計人員專
業(yè)化和統(tǒng)計方法多樣化,同時,統(tǒng)計的運用更加廣泛。
17世紀以來,西方國家由于工業(yè)、商業(yè)、農業(yè)、通信、貿易和交通的發(fā)展,統(tǒng)計實踐
從國家管理領域擴展到社會經濟活動等很多領域。
從18世紀起,出現(xiàn)了專業(yè)的統(tǒng)計機構,開始搜集統(tǒng)計資料,定期或不定期進行人口、
工業(yè)、農業(yè)、貿易和交通等調查,出版統(tǒng)計刊物,建立國際統(tǒng)計組織,召開國際統(tǒng)計會議。
統(tǒng)計實踐的快速發(fā)展從20世紀開始,得益于電子計算技術的推廣和運用,其主要特點
是打破了時空和計算的壁壘,數(shù)據(jù)成為“貨幣”開始交易。除了依IH注重為國家管理服務
外,也注重國際交流和個性服務,數(shù)據(jù)分析人才成為社會精英,統(tǒng)計學派和統(tǒng)計著作層出
不窮。從21世紀開始,大數(shù)據(jù)時代來臨,統(tǒng)計學的運用能更多更好地造福人類。
數(shù)據(jù)是軟黃金。如果有人不知道證券交易所,這不稀奇。如果有誰不知道大數(shù)據(jù)交易
所,那就落伍了。
全球第一家大數(shù)據(jù)交易所,即“貴陽大數(shù)據(jù)交易所”,2015年4月正式掛牌營運,總
部位于中國貴州省,在北京和上海設立運營中心,其目的在于促進數(shù)據(jù)要素流通融合,驅
動大數(shù)據(jù)產業(yè)發(fā)展。2017年12月與美國芝加哥商品交易所達成共識:“貴陽大數(shù)據(jù)交易
所將接入美國芝加哥商品交易所的數(shù)據(jù),共同拓展商業(yè)數(shù)據(jù)模塊開發(fā)空間?!钡?018年年
初,貴陽大數(shù)據(jù)交易所的會員企業(yè)已突破1500家,交易額累計突破1億元人民幣,交易數(shù)
據(jù)產品接近4000個。
3.統(tǒng)計學說簡史
統(tǒng)計學源于統(tǒng)計實踐。統(tǒng)計學誕生于17世紀中葉,創(chuàng)始人是英國的威廉?配第。翻開
統(tǒng)計學的典籍,有以下學派載入史冊。
第一個時期:獨立的統(tǒng)計學派(17世紀中葉一19世紀中葉)。
統(tǒng)計學說源起于以下兩個學派的貢獻:國勢學派、政治算術學派。
國勢學派是有名無實的統(tǒng)計學派,發(fā)源地在德國。
國勢學派以社會經濟現(xiàn)象為研究對象,以社會調查為研究基礎,由于只注重文字分析,
因此這個學派被稱為“有名無實”的統(tǒng)計學派。
17—18世紀,國勢學派誕生于嚴謹?shù)牡聡?,代表人物是赫爾?康令(1606-1681)和高
特弗洛里特?阿亨瓦爾(1719—1772)。他們主張用記述的方法記錄國家的重大事項,諸如政
治、軍事、經濟等,希望從中理出歷代興亡的軌跡,從而為統(tǒng)治者效勞。
國勢學派的標志性事件是在大學首次開設“國勢學”課程,首先提出“統(tǒng)計學”一詞。
166()年,康令首次在西爾姆斯特大學開講“國勢學”課程,教學目的為“授人以政治
經營所需的知識”,教學內容主要為各國的人口、土地財政、國家組織與結構等“國家的
重大事項”。1749年,阿亨瓦爾在其出版的《近代歐洲各國國勢學論》一書中首次提出“統(tǒng)
計學”這一名詞,并將“統(tǒng)計學”定義為記述國家重大事項的學問。
政治算術學派是有實無名的統(tǒng)計學派,發(fā)源地在英國。
政治算術學派以社會經濟現(xiàn)象為研究對象,以社會調查為研究基礎,注重數(shù)量分析,
為統(tǒng)計學的創(chuàng)立奠定了方法論基礎,但由于他們在所有著述中并沒有提到“統(tǒng)計學”這幾
個字,因此這個學派也被稱為“有實無名”的統(tǒng)計學派。
17世紀中葉,政治算術學派誕生于風雅的英國,代表人物是威廉?配第(1623—1687)和
約翰?格朗特(1620-1674)。他們主張用數(shù)量對比分析的方法,對英國與法國、荷蘭的國情
進行比較,以明確英國的國際地位。
政治算術學派的代表作有《政治算術》和《對死亡率公報的自然和政治觀察》?!墩?/p>
治算術》是第一部數(shù)量分析的著作,《對死亡率公報的自然和政治觀察》是第一部關于人
口統(tǒng)計的著作。
配第在《政治算術》一書中,用數(shù)量分析的方法,對比了英國和法國、荷蘭的“財富
和力量”,批駁了盛行于本國的“英國悲觀論”。由于最早提出并實踐了數(shù)量分析的方法,
配第被尊稱為“統(tǒng)計學的創(chuàng)始人”,他也是“政治經濟學之父”。
格朗特,配第的朋友,他在《對死亡率公報的自然和政治觀察》一書中,對倫敦50多
年的人口出生和死亡資料進行了計算和分析。
現(xiàn)在,“統(tǒng)計學原理”“國際統(tǒng)計學”“人口統(tǒng)計學”己成了大學里常開的課程。而
“中國人壽保險業(yè)經驗生命表”,即反映社會平均年齡及不同年齡人群的生存概率和死亡
概率的數(shù)據(jù)表格,已被廣泛應用于壽險產品定價、風險管理等各個方面,是保險行業(yè)防范
風險的重要手段和條件。
第二個時期:融而不合的統(tǒng)計學派(19世紀中葉一20世紀中葉)。
社會經濟統(tǒng)計學派一一迅速發(fā)展的統(tǒng)計學派,發(fā)源地在德國。
19世紀,社會經濟統(tǒng)計學派興起于德國,是政治算術學派的延伸,代表人物是恩斯特?
恩格爾(1821—1896)和喬治?馮?梅爾(1841—1925)。他們主張統(tǒng)計學是研究社會現(xiàn)象的社會
科學,融合了國勢學派和政治算術學派的觀點,并把政府統(tǒng)計和社會調查融合起來,進而
形成社會經濟統(tǒng)計學。社會經濟統(tǒng)計學派在理論上比政治算術學派更加完善,在時間上比
數(shù)理統(tǒng)計學派提前成熟,因此在國際統(tǒng)計學界影響很大。
數(shù)理統(tǒng)計學派一融合卻走偏的統(tǒng)計學派,發(fā)源地是比利時。
19世紀,數(shù)理統(tǒng)計學派誕生于美麗的比利時,代表人物是阿道夫?凱特勒(1796—1874),
代表作有《統(tǒng)計學的研究》和《關于概率論的書信》。他們主張將概率論應用于人口、人
體測量和犯罪等問題的研究,創(chuàng)建了抽樣理論、相關和回歸理論等,完成了統(tǒng)計學和概率
論的結合。數(shù)理統(tǒng)計學派把國勢學派、政治算術學派、概率統(tǒng)計學派的分析方法,融合為
一門統(tǒng)計學,但主張概率論就是統(tǒng)計學,否認社會經濟統(tǒng)計學的存在。
19世紀中葉,各國政府成立了統(tǒng)計部門,有了統(tǒng)計職業(yè),有了專業(yè)的統(tǒng)計人員從事統(tǒng)
計事業(yè)。
1851年,首屆國際統(tǒng)計學會議由凱特勒組織,在比利時首都召開。1885年,首個國際
性統(tǒng)計組織即“國際統(tǒng)計學會”在英國倫敦成立。國際統(tǒng)計學會是聯(lián)合國教科文組織的咨
詢機構,宗旨是通過國際活動與合作,發(fā)展與改善統(tǒng)計方法及其應用。
1979年,中國統(tǒng)計學會正式成立。同年,被國際統(tǒng)計學會接納為團體會員。1995年,
首次在北京舉辦第5()屆世界統(tǒng)計大會。
圖1-4所示為統(tǒng)計學的創(chuàng)始人威廉?配第和他的著作。
圖1-4統(tǒng)計學的創(chuàng)始人威廉?配第和他的著作
威廉?配第,統(tǒng)計學家和音樂教授,出生于英國一個手工業(yè)者家庭。他說:“我進行這
種工作所使用的方法,在目前還不是常見的,因為我不采用比較級或最高級的詞語進行思
辨式的議論,相反地,采用這樣的方法,即用數(shù)據(jù)、重量和尺度來表達自己想說明的問題?!?/p>
圖1-5所示為中國統(tǒng)計學會的創(chuàng)始人李成瑞和他的書法作品以及中國統(tǒng)計學會的網站。
要
孑
,
皚
疝
儀
S4創(chuàng)
圖1-5中國統(tǒng)計學會的創(chuàng)始人李成瑞和中國統(tǒng)計學會網站
李成瑞(1921—2017),統(tǒng)計學家和桂冠詩人。他出版了統(tǒng)計類書籍十多部,如《中國
人口問題研究》《中國人口地圖集》《社會經濟統(tǒng)計學原理教程》。他于1986年當選為國
際統(tǒng)計學會副主席,2006年獲首屆“華夏詩詞獎”一等獎。中國作家魏巍說:“在他充滿
激情的詩篇背后,是以事實數(shù)據(jù)和冷靜思考為基礎的。”
第三個時期:合流的統(tǒng)計學派(20世紀中葉至今)。
這個時期,社會經濟統(tǒng)計學派和數(shù)理統(tǒng)計學派出現(xiàn)了融合的趨勢,強調相互借鑒、共
同發(fā)展。這一時期,統(tǒng)計學界人才輩出,方法層出不窮。比如,英國人費希爾(R.A.Fisher,
1890—1962)提出了假設檢驗、方差分析等方法,中國人薛暮橋(1904—2005)創(chuàng)新了“劃類
選典”等調查方法。同時,時間序列分析、多元統(tǒng)計分析等方法也應運而生并蓬勃發(fā)展。
在中國,1949年以前,統(tǒng)計工作無序,統(tǒng)計學基本上是照搬西方統(tǒng)計理論,傳播的主
要是數(shù)理統(tǒng)計學派的觀點。1949—1978年,統(tǒng)計學基本上是照搬蘇聯(lián)統(tǒng)計理論,傳播的是
社會經濟統(tǒng)計學派的觀點,而數(shù)理統(tǒng)計學派遭到了批判。1979年,統(tǒng)計學界經過激辯,達
成共識,認為數(shù)理統(tǒng)計學與社會經濟統(tǒng)計學一樣,都是獨立的統(tǒng)計學科。2011年,統(tǒng)計學
劃入國家一級學科,與數(shù)學、經濟學、計算機科學同屬一個級別。隨著統(tǒng)計學學科體系的
建立,統(tǒng)計學作為一門獨立的科學,其運用已滲透到各個領域。
未來的統(tǒng)計學怎么走?可以預見,統(tǒng)計學將更具全球化、人性化和生活化。隨著電子
信息和網絡技術的發(fā)展,全球統(tǒng)計學將應運而生,各國統(tǒng)計圈的交往和合作將更頻繁。同
時,個體統(tǒng)計學也將走俏,統(tǒng)計學將青睞個人,《幸福統(tǒng)計學》《愛情統(tǒng)計學》《個人健
康統(tǒng)計學》《個人理財統(tǒng)計學》《網絡統(tǒng)計學》之類將層出不窮。
1.3統(tǒng)計語言是數(shù)據(jù)
1.統(tǒng)計語言的8個要素
數(shù)據(jù)是統(tǒng)計的語言,統(tǒng)計語言又稱數(shù)據(jù)語言。統(tǒng)計語言最大的特點就是數(shù)據(jù)性。
既然是語言,就不要先講用得活不活,而要先講用得是不是規(guī)范。一句統(tǒng)計語言,如
果用得不規(guī)范,哪怕用得再靈活,也是病句一個。本節(jié)重點講解統(tǒng)計語言的標準用法。
先看下面一小段對話。
老師:數(shù)字就是數(shù)據(jù)嗎?
學生:不是。數(shù)字是光溜溜的,光桿司令,1是數(shù)字,1就是1,無依無傍。
老師:數(shù)字是光桿司令,數(shù)據(jù)呢?
學生:呃,數(shù)據(jù)都有依據(jù),有計量的單位,有……
老師:數(shù)據(jù)不是光桿司令,每個數(shù)據(jù)都是一朵格葵花,格?;ㄌ焐?個花瓣,少一
個都不行。
規(guī)范的統(tǒng)計語言,由8個要素構成:時間、空間、總體、指標名稱、指標數(shù)值、計量
膽位、計算方法和資料來源。
誰能夠把統(tǒng)計語言的8個要素一個不落地背下來,誰能夠呢?估計很難。下面舉例來
看,有了實例的幫忙,就能化難為易,就能牢牢記住這朵風姿迷人的8瓣“格桑花”了。
格?;ǖ幕ㄕZ為“幸福之花”,如圖1-6所示。
圖1-68瓣格?;?/p>
2.統(tǒng)計語言的純正表達
【例1-1】玩一玩數(shù)據(jù)擴充的游戲。
游戲的玩法:請把本班的人數(shù),擴充為數(shù)據(jù)。你寫的這個數(shù)據(jù),不僅自己看得懂,外
面的人也看得懂。
學生甲:“我們班30人?!边@樣寫可以嗎?
學生乙:這樣寫肯定不行,因為外面的人看不懂。
“我們班3()人”這句話,沒寫是哪個年級,缺了時間;沒寫是哪所大學,缺了空間;
沒有寫是哪個專業(yè)、哪個班級的學生,缺了總體對象的定位;沒有寫數(shù)據(jù)是怎么來的,缺
了資料來源。
把“我們班30人”中的數(shù)字“30”擴充為數(shù)據(jù),只耍有心,心里有標準,就能完美地
表達統(tǒng)計語言。
【例1-2】用一用純正的統(tǒng)計語言。
問:下面這個資料,數(shù)據(jù)的表達怎么樣?
資料:中國互聯(lián)網絡信息中心(CNNIC)發(fā)布的第44次《中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報
告》顯示,用抽樣法進行調查,截至2019年6月,中國網民規(guī)模達到8.54億人。
答:在上面的資料中,數(shù)據(jù)的表達規(guī)范,符合統(tǒng)計語言8個要素的基本要求。
2019年中國全部網民網民規(guī)模8.54億人抽樣法CNNIC
1111
④指標⑤指標⑥計量⑦計算⑧資料
①時間②空間③總體
名稱數(shù)值單位方法來源
注:中國互聯(lián)網絡信息中心(ChinaInternetNetworkInformationCenter,CNNIC)。
一朵8瓣的格?;?,一句8個要素的統(tǒng)計語言,記住了統(tǒng)計語言,對寫作也有好處。
【例1-3】看一看統(tǒng)計語言的國家標準。
結合中華人民共和國國家標準《出版物上數(shù)字用法》(GB/T15835—2011),逐個解讀
統(tǒng)計語言的8個要素。
阿拉伯數(shù)字為0、1、2、3、4、5、6、7、8、9。
中文的小寫數(shù)字為O、一、二、三、四、五、六、七、八、九、十、百、千、萬、億。
中文的大寫數(shù)字為零、壹、貳、叁、肆、伍、陸、柒、拐k玖、拾、佰、仟、萬、億。
一是時間為數(shù)據(jù)的出生日。
正式表達時間,講求準確無誤。一要表達清楚,不要用“今年”和“本期”這類語焉
不詳?shù)淖盅?。二要表達完整,如“2020級”不要用“20級”表示,“2020年”不要用“20
年”表示。三要符合標準,阿拉伯數(shù)字和漢字數(shù)字不能混在一起寫,如“2020年”可以寫
成“二。二O年”,但不能寫成“二0二0年”。
二是空間為數(shù)據(jù)的出生地。
正式表達空間的時候,也要講求準確和完整,如“中國”不要用“我國”表示,“中
國人民銀行”不要用“人行”表示。在網絡世界,語焉不詳?shù)谋磉_,不利于有效傳播。
三是總體和個體為數(shù)據(jù)研窕的主角。
統(tǒng)計學的研究對象是總體的數(shù)量方面,統(tǒng)計學的作用在于通過數(shù)據(jù)認識總體的特征和
規(guī)律。例如,中國的全部網民就是一個總體,中國的每一個網民就是一個個體。
總體由具有同質性的大量個體構成。總體具有“三性”:同質性、大量性和差異性。
總體的這“三性”,可以用“求同存異”這個成語來幫助記憶。同質性是指構成總體的個
體必須具有共同的性質;大量性是講要從數(shù)量方面認識總體,必須獲得大量有效數(shù)據(jù),并
從中提取有價值的信息;差異性是講個體之間存在差異。
四是指標名稱為說明總體的數(shù)據(jù)名稱。
指標名稱的定義要科學,同一個指標名稱,不同的定義,就會有不同的統(tǒng)計結果。如
中國網民規(guī)模是指過去半年內使用過互聯(lián)網的6周歲及以上的全部中國居民。
五是指標數(shù)值為說明總體的數(shù)值。
指標數(shù)值常用阿拉伯數(shù)字表示。
阿拉伯數(shù)字不能出現(xiàn)與漢字數(shù)字混在一起寫的情形,如“1000”,可以寫成“一千”,
但不能寫成“1千”。
概約數(shù)用小寫的漢字數(shù)字來表達,如平均年齡“二十幾歲”。
數(shù)值的范圍常用波浪線“?”呈現(xiàn),如1%?2%。
六是計量單位為每個數(shù)據(jù)必備。在用計量單位的時候,一要寫,二要寫全。計量單位,
不能不寫,也不能把“億人”寫成“億”。
七是計算方法為計算數(shù)據(jù)的方法。
數(shù)據(jù)的類型不同,計算的方法也不完全一樣。
八是資料來源為數(shù)據(jù)的品質保證。
資料來源要權威,不僅要記得寫,還要寫全。寫好資料來源,這是對數(shù)據(jù)提供者應
有的尊重,同時也便于查詢和核實數(shù)據(jù)。數(shù)據(jù)源于網絡,應做好超鏈接,最好寫出網絡
路徑。
3.統(tǒng)計術語的詳細解讀
記住了統(tǒng)計語言的純正用法,不僅確保自己會用,還能有模有樣地評判別人用得是否
規(guī)范,當然,還有一大好處,就是順路記住了統(tǒng)計學的兒個基本術語:總體、統(tǒng)計指標、
個體、標志。統(tǒng)計指標用于說明總體的特征,標志用于說明個體的特征。
【例1-4]看一看統(tǒng)計術語的內幕。
班長的小報告:統(tǒng)計專業(yè)這個班有30名同學,男女各半,平均年齡為20歲。同學們
愛好廣泛,平常喜歡上網、運動等。我們每一位都有特長:班草,李帥21歲,最厲害的是
寫得一手好字;班花,王美20歲,天生喜歡唱歌跳舞……噢,換個形式來說吧,下面是兩
份表格清單,如表1-1和表1-2所示,請過目。
表1-1個體數(shù)據(jù)表
序號姓名性別年齡愛好
1李帥男21書法
2王美女20音樂
1匯總
表1-2總體數(shù)據(jù)表
性別人數(shù)/人各組人數(shù)所占構成比/%平均年齡/歲
男155020
女155020
總計3010020
ttt
總量數(shù)相對數(shù)平均數(shù)(均值)
由表1-1和表1-2兩份清單,可以得到這個班學生的基本情況,如表1?3所示。
表1-3學生的基本情況
個體數(shù)據(jù)(標志):總體數(shù)據(jù)(統(tǒng)計指標):
說明個體說明總體
主體個體總體數(shù)量質量
品質標志數(shù)量標志
指標指標
名稱表現(xiàn)名稱表現(xiàn)總量數(shù)相對數(shù)均值
學號1,2……21歲、男女平均
每個全部總人數(shù)
學生性別男,女年齡20歲各占年齡
學生學生30人
愛好書法……??????50%20歲
接下來,以例1-4來說明統(tǒng)計學中的兒個基本概念的運用。
個體是指構成總體的基本單位,又稱“總體單位”。
個體是由個體名稱和個體名稱的具體表現(xiàn)構成。比如,每一個學生是個體,都是這個
班集體中的一員?!皭酆谩笔莻€體的名稱,“書法”是個體名稱的具體表現(xiàn)。
個體數(shù)據(jù)是指說明個體的數(shù)據(jù),又叫“標志”。
標志由標志名稱和標志名稱的表現(xiàn)構成。標志按說明個體特征的不同,分為品質標志
和數(shù)量標志。品質標志是指說明個體的屬性特征,品質標志的取值就是品質標志的表現(xiàn)。
比如,每個學生的性別是品質標志的名稱,男、女是品質標志的表現(xiàn)。數(shù)量標志是指說明
個體的量化特征,數(shù)量標志的取值叫標志值。比如,年齡是數(shù)量標志的名稱,21歲是數(shù)量
標志的標志值。
總體是指由具有某種共同性質的全部總體單位所組成的集合體.
總體有3個特點,即同質性、差異性和大量性。同質性是指構成總體的個體在某方面
具有完全相同的性質;差異性是指構成總體的個體在其他方面具有不完全相同的性質;大
量性是指構成總體的個體要足夠多。同質性和差異性,可以用成語“求同存異”來記憶。
比如,總體是全班學生,全班學生是由每一個學生所組成的集體。每一個學生,既有
共性又有個性。共性表現(xiàn)在他們都是同一年級、同一專業(yè)的,這些共同點使他們有緣成為
同班同學。而每一個學生又有個性,存在個體差異,如果每個學生各方面都一模一樣,那
就不需要統(tǒng)計了。同時,要了解全班同學的特點,只用兩三個學生的情況來說明顯然不夠。
總體數(shù)據(jù)是指說明總體的數(shù)據(jù),俗稱“統(tǒng)計數(shù)據(jù)”,專業(yè)術語稱為“統(tǒng)計指標”。統(tǒng)
計的語言是統(tǒng)計指標,其表現(xiàn)形式有3種,即總量指標、相對指標和平均指標。總量指標
表示總體的總量規(guī)模,相對指標表示總體的對比程度,平均指標表示總體的一般水平。
總量指標、相對指標和平均指標,分別稱為總量數(shù)、相對數(shù)和平均數(shù)。總量數(shù)、相對
數(shù)和平均數(shù),簡稱“三數(shù)”O(jiān)
比如,說明全班學生這個總體的“三數(shù)”有:總人數(shù)30人(即總量數(shù))、男女各占50%(即
相對數(shù))、平均年齡2()歲(即均值)。
值得一提的是“變量”。“變量”來自數(shù)學領域,“變量”來到統(tǒng)計世界以后,眾說
紛紜,有的說“變量”是指個體數(shù)據(jù),有的說“變量”是指總體數(shù)據(jù),還有的認為“變量”
既指個體數(shù)據(jù),乂指總體數(shù)據(jù)。
本書認為,統(tǒng)計已有了自己的專業(yè)術語,面對舶來品“變量”,不妨采取包容之心,
讓它代表個體數(shù)據(jù)和總體數(shù)據(jù)。但在運用“變量”時,只要對個體和個體數(shù)據(jù)、總體和總
體數(shù)據(jù)之間的關系留意一下就好了。
記住了統(tǒng)計語言,好處多多,其中一個好處,就是順便知道了數(shù)據(jù)的幾個基本分類。
1.4數(shù)據(jù)的基本分類
茫茫人海,人可以按“性別”分為“男”和“女”。
茫茫數(shù)海,數(shù)據(jù)可以從統(tǒng)計語言的8個要素出發(fā)進行分類。
統(tǒng)計語言的8個要素,包括時間、空間、總體、指標名稱、指標數(shù)值、計量單位、計
算方法和資料來源。接下來看一看數(shù)據(jù)的基本分類。
知道了統(tǒng)計語言的8個要素,也就知道了數(shù)據(jù)的8種基本分類。
其一,數(shù)據(jù)從時間來看,分為靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)。
靜態(tài)數(shù)據(jù)是指在相同時間上的數(shù)據(jù)。
動態(tài)數(shù)據(jù)是指在不同時間上的數(shù)據(jù)。
比如,某年的網民人數(shù)是靜態(tài)數(shù)據(jù),歷年的網民人數(shù)是動態(tài)數(shù)據(jù)。
本書的第4章和第5章關注靜態(tài)數(shù)據(jù)的用法,第6章和第7章關注動態(tài)數(shù)據(jù)的用法,
第8章是兩類數(shù)據(jù)的綜合運用。
其二,數(shù)據(jù)從空間來看,或從獲取數(shù)據(jù)的方法來看,分為觀測數(shù)據(jù)和實驗數(shù)據(jù)。
觀測數(shù)據(jù)是指在非實驗環(huán)境下,對現(xiàn)象進行實地觀測所取得的數(shù)據(jù)。在取得數(shù)據(jù)的過
程中,一般沒有人為的控制和條件約束。觀測數(shù)據(jù)可能是全部數(shù)據(jù),也可能是部分數(shù)據(jù)。
實驗數(shù)據(jù)是指在實驗環(huán)境下,對現(xiàn)象進行實驗所取得的數(shù)據(jù)。在取得數(shù)據(jù)的過程中,
實驗環(huán)境受到人為的控制和條件約束,實驗數(shù)據(jù)都是部分數(shù)據(jù)。
比如,網民人數(shù)是觀測數(shù)據(jù),在實驗室做實驗得到的數(shù)據(jù)是實驗數(shù)據(jù)。
本書關注觀測數(shù)據(jù)的用法。
其三,數(shù)據(jù)從總體來看,分為個體數(shù)據(jù)、樣本數(shù)據(jù)和總體數(shù)據(jù)。
個體數(shù)據(jù)是指說明個體的數(shù)據(jù)。
總體數(shù)據(jù)是指說明總體的數(shù)據(jù)。
樣本數(shù)據(jù)是指總體中的部分數(shù)據(jù)。
沒有個體數(shù)據(jù)就沒有總體數(shù)據(jù),總體數(shù)據(jù)來源于人體數(shù)據(jù)。
比如,每個網民的數(shù)據(jù)就是個體數(shù)據(jù),把每個網民的數(shù)據(jù)匯總起來就得到所有網民的
總體數(shù)據(jù)。
其四,數(shù)據(jù)從指標名稱來看,分為總量指標、相對指標和平均指標。
總量指標、相對指標和平均指標分別說明總體的總量水平、相對水平和平均水平。
比如,網民的總人數(shù)、性別構成比、平均年齡分別為總量指標、相對指標和平均指標。
其五,數(shù)據(jù)從指標數(shù)值來看,分為總量數(shù)、相對數(shù)和平均數(shù),簡稱“三數(shù)”。
總量數(shù)、相對數(shù)和平均數(shù)分別是總量指標、相對指標和平均指標的具體取值。
本書從頭到尾都在應用“三數(shù)”。
其六,數(shù)據(jù)從計量單位來看,分為用實物單位和貨幣單位計量的數(shù)據(jù)。數(shù)據(jù)從計量形
式來看,分為用百分號、干分號等符號表示的數(shù)據(jù)。
比如,網民的平均年齡屬于均值,計量單位是實物單位。所有網民的上網費用是總量
數(shù),計量單位為貨幣單位。男性網民占全部網民的構成比是相對數(shù),計量形式是百分數(shù)。
其七,數(shù)據(jù)從計算方法來看,根據(jù)現(xiàn)象的特點,可以分為用靜態(tài)分析方法計算的靜態(tài)
數(shù)據(jù)和用動態(tài)分析方法計算的動態(tài)數(shù)據(jù)。
比如,用靜態(tài)分析方法計算數(shù)據(jù)的現(xiàn)狀,用動態(tài)分析方法計算數(shù)據(jù)的變化。
數(shù)據(jù)從計算方法來看,根據(jù)計算的結果,可以分為用描述統(tǒng)計法計算的數(shù)據(jù)和用推斷
統(tǒng)計法計算的數(shù)據(jù)。
描述統(tǒng)計法是指研究搜集、整理和描述數(shù)據(jù)的統(tǒng)計學方法。
推斷統(tǒng)計法是指研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學方法。
本書第5章專注于推斷統(tǒng)計法,其余章節(jié)的方法歸類到描述統(tǒng)計法。
其八,數(shù)據(jù)從來源來看,分為一手數(shù)據(jù)和二手數(shù)據(jù)。
一手數(shù)據(jù)是自己調查得到的原始數(shù)據(jù)。
二手數(shù)據(jù)是利用別人調查得到的數(shù)據(jù)。
比如,中國互聯(lián)網絡信息中心發(fā)布的數(shù)據(jù),對調查者而言是一手數(shù)據(jù),對其他使用者
而言是二手數(shù)據(jù)飛
本書第2章重點關注一手數(shù)據(jù)和二手數(shù)據(jù)的搜集。
【例1-5】看一看數(shù)據(jù)類型的風光。
問:下面這個資料,數(shù)據(jù)類型的風光在哪里?
資料:據(jù)中國國家衛(wèi)生健康委員會統(tǒng)計,截至2020年3月7日,在支援湖北省抗擊新
冠肺炎疫情的4.2萬名醫(yī)務人員中,1990后和2000后有1.2萬人。
答:數(shù)據(jù)類型的風光,可以從數(shù)據(jù)的分類來看。
從數(shù)據(jù)的時間看,屬于靜態(tài)數(shù)據(jù)。從數(shù)據(jù)的空間看,為觀測數(shù)據(jù)。
從數(shù)據(jù)的總體范圍看,屬于總體數(shù)據(jù)。從指標名稱的取值看,為數(shù)值型數(shù)據(jù)。
從指標數(shù)值的作用看,屬于總量數(shù)。從數(shù)據(jù)的計算單位看,為實物單位計量的數(shù)據(jù)。
從數(shù)據(jù)的計算方法看,屬于用靜態(tài)方法計算的靜態(tài)數(shù)據(jù)。從資料來源看,為二手數(shù)據(jù)。
1.5Excel的基礎應用
統(tǒng)計學這門學科?,自從有了計算機的助力,簡直如虎添翼。
統(tǒng)計學世界,就是平常又神奇的數(shù)據(jù)世界。計算機的出現(xiàn),讓人擺脫了煩瑣的數(shù)據(jù)計
算,讓人通過數(shù)據(jù)速算的隧道,直達認識對象的內核,直接享受用數(shù)據(jù)說話的樂趣。Excel
實現(xiàn)統(tǒng)計分析的主要途徑有公式、函數(shù)和“數(shù)據(jù)分析”工具。
本書上機操作的內容全部在Excel2010的電子表格中完成。
本部分內容,共有3個干貨。
一是Excel2010界面的簡介。
二是Excel中數(shù)字的基本算法。
三是Excel“數(shù)據(jù)分析”工具的調用。
接下來,看一看Excel2010的界面,就是在這個平臺上,數(shù)據(jù)的精彩,瞬間綻放。
【例1-6】Excel2010界面簡介。
圖1-7所示為Excel2()1()的操作界面,從上往下,包括標題欄、菜單欄、功能區(qū)、工
作區(qū)和狀態(tài)欄。
快速訪問工具欄標題欄
A8CDEF
編糧閆I
工作區(qū)
.?
/8
Sheet3
狀態(tài)欄今
圖1-7Excel2010的操作界面
標題欄位于最頂層,左邊為快速訪問工具欄,右邊為標題。
菜單欄由1個“文件”按鈕和7個選項卡組成。7個選項卡,從左到右依次為“開始”
“插入”“頁面布局”“公式”“數(shù)據(jù)”“審閱”“視圖”。圖1-7中,就是“開始”選
項卡的功能區(qū)的界面。
功能區(qū)位于菜單欄的下方。單擊每個選項卡的標簽,就有相應的選項組,所有選項組
的區(qū)域統(tǒng)稱為“功能區(qū)”。
工作區(qū)中的每張工作表,共有65536列和行。
狀態(tài)欄位于最底層,顯示工作表當前的狀態(tài)。
在功能區(qū)和工作區(qū)之間,左邊短的條形框是名稱框,顯示單元格或單元格區(qū)域所在的
位置;右邊長的條形框是編輯欄,顯示在單元格中輸入的內容;中間的3個按鈕,從左到
右依次為“x”“4”“工,”,分別表示“取消”“輸入”“插入函數(shù)”。用插入函數(shù)計
算數(shù)據(jù),單擊編輯欄左側的插入函數(shù)“小,”按鈕,就進入到“插入函數(shù)”對話框。Excel
提供了435個函數(shù),全方位滿足各界人士對數(shù)據(jù)計算的需求。插入函數(shù)由函數(shù)名稱和數(shù)據(jù)
區(qū)域組成,插入函數(shù)的名稱很容易記,一般都為相應的英文單詞,如求和的函數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 漢字猜字謎課件
- 貴州省貴陽市普通高中2024-2025學年高一下學期期末監(jiān)測化學試題(含答案)
- 2024-2025學年江蘇省南京市六合區(qū)蘇教版四年級下冊期末考試數(shù)學試卷(含部分答案)
- 0-3歲嬰幼兒保育與教育(1+x幼兒照護)知到智慧樹答案
- 餐飲行業(yè)市場潛力分析
- 2024年秋新北師大版數(shù)學一年級上冊教學課件 第四單元 10以內數(shù)加與減 第8課時 挖紅薯
- 永州消防知識培訓課件
- 跨境電子商務雙語教程 習題和答案Chapter 4
- 水表檢定基礎知識培訓課件
- 混凝土施工中表面光潔度控制方案
- 2025年云南省高校大學《輔導員》招聘考試題庫及答案
- 消費品市場2025年消費者對綠色包裝認知及需求調研可行性研究報告
- 臺球廳消防知識培訓課件
- 充電樁運維服務協(xié)議
- 2025至2030中國防砸安全鞋行業(yè)運營態(tài)勢與投資前景調查研究報告
- 地質災害培訓班滑坡防治工程勘查規(guī)范
- 常見遺傳性代謝疾病的早期診斷和治療課件
- 工程項目成本核算制度
- um-joyo c2001跨平臺監(jiān)控防誤一體化系統(tǒng)使用說明書
- 輸液泵/微量注射泵使用技術操作考核評分標準
- 國家科學技術獎學科專業(yè)評審組評審范圍簡表
評論
0/150
提交評論