




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
計量經(jīng)濟學(xué)及其應(yīng)用第2章Stata軟件簡介與基本操作Catalogue目錄錄入和存儲2.1.Stata軟件簡介繪制圖形數(shù)據(jù)處理3.4.其他命令5.思考與練習(xí)6.01Stata軟件簡介Stata軟件簡介Stata軟件主要是通過輸入命令來進行各種計量分析和處理工作,命令語言可以另存為Do-file文件,方便回溯操作過程。本書主要以Stata13.1為基礎(chǔ),講解它的使用方法。Stata軟件的啟動圖2-1Stata主菜單界面方法1:在Windows操作系統(tǒng)的桌面下,單擊“開始”按鈕,然后選擇“所有程序(P)”中的Stata執(zhí)行程序軟件。方法2:在我的電腦下,逐步進入Stata目錄,選擇Stata執(zhí)行程序軟件。方法3:如果桌面上有Stata執(zhí)行程序圖標(biāo),則雙擊該圖標(biāo)。方法4:如果存在已經(jīng)建立的Stata文件,則直接雙擊該文件圖標(biāo)。當(dāng)程序啟動后,將顯示如圖2-1的Stata的主菜單界面。這個窗口由6個部分組成:標(biāo)題欄、主菜單、工具欄、結(jié)果窗口、命令窗口、歷史記錄。Stata軟件的啟動圖2-2Stata主菜單界面2通常,采用操作“Window/Variables”調(diào)出變量窗口“Variables”,顯示出數(shù)據(jù)集中的變量名稱和變量個數(shù),方便后續(xù)進行計量分析,新的主菜單界面如圖2-2所示。Stata軟件的啟動如果想對Stata的主菜單窗口進行更改,可以通過操作“Edit/Preference/GeneralReference”,打開圖2-3所示的對話框,將主菜單界面更改為自己喜歡的布局和顏色。更改后若想回到最初的界面,進行操作“Window/Review”即可。
圖2-3主菜單界面更改對話框
Stata軟件基礎(chǔ)操作圖2-4Do-file編輯窗口1.文件編輯器Do-file在Command窗口可以直接輸入命令,但是這種輸入方式限制較大且不便于保存,很不方便。在實際操作中,通常點擊工具欄中的圖標(biāo),打開如圖2-4所示的Do-file編輯窗口,在Do-file文件中編程。這樣做的好處是可以記錄我們需要的命令,很方便地執(zhí)行以前寫過的命令,便于下一次的使用和分析。要知道,在處理一些復(fù)雜的數(shù)據(jù)時,常常無法一次性完成,這時Do-file文件的記憶存儲功能就顯得尤為重要。在Do-file文件中輸入命令時,可以用一些符號表示注釋內(nèi)容,加入注釋語句能增強命令的可讀性,格式如下:方法1://注釋內(nèi)容方法2:*注釋內(nèi)容方法3:/*注釋內(nèi)容*/Stata軟件在運行命令時會跳過這些注釋語句,在實際操作中,應(yīng)該養(yǎng)成為重要的命令注明注釋內(nèi)容的習(xí)慣,例如說明命令的結(jié)果、操作的目的等,方便后續(xù)的工作。Stata軟件基礎(chǔ)操作2.日志文件log日志文件像是一個忠實的記錄員,它可以幫助記錄Stata軟件運行的所有命令和結(jié)果,包括錯誤。操作命令格式如下-logusingC:\Users\Lenovo\Stata.log……-logclose這樣,Stata.log文件就記錄了從“l(fā)ogusing”命令到“l(fā)ogclose”命令之間Stata軟件運行的所有結(jié)果,Stata.log文件被存儲在C:\Users\Lenovo中。02錄入和存儲數(shù)據(jù)錄入圖2-5數(shù)據(jù)錄入窗口01在數(shù)據(jù)錄入窗口中,選中單元格后直接輸入數(shù)據(jù)即可。點擊屬性窗口(Properties),可以編輯變量的名稱、標(biāo)簽、類型等。如果錄入數(shù)據(jù)后,沒有給出變量名,則Stata軟件會按序默認為變量名為var
,其中,
為順序號。2.復(fù)制粘貼如果數(shù)據(jù)在其它文檔中,可在其它文檔的管理中先進行復(fù)制,然后把數(shù)據(jù)粘貼到圖2-5所示的表中。在進行各種統(tǒng)計分析和計量分析之前,首先需要將數(shù)據(jù)錄入到Stata軟件中,數(shù)據(jù)錄入方法主要有下面幾種。1.鍵盤錄入方法1:在Do-file文件中,輸入命令并運行-edit方法2:在工具鍵欄目,單擊圖標(biāo)。方法3:在主菜單欄目,選擇“Data/DataEditor/DataEditor(Edit)”,將出現(xiàn)圖2-5所示的數(shù)據(jù)錄入窗口。數(shù)據(jù)錄入3.文件導(dǎo)入事實上,大多數(shù)數(shù)據(jù)都存在Excel文件中,我們可以把Excel中的數(shù)據(jù)直接導(dǎo)入到Stata工作文件中。在主菜單下,選擇File/Import/Excelspreadsheet,出現(xiàn)圖2-6所示對話框,在Browse中找到包含所需數(shù)據(jù)的Excel(.xls;.xlsx)文件,單擊確認鍵(OK)即可。在工作頁(Worksheet)可以選擇導(dǎo)入的Excel表格頁面,在單元格范圍(cellrange)可以選擇輸入數(shù)據(jù)的樣本區(qū)間,在下方可以勾選“將第一行導(dǎo)入為變量名”或者“全部導(dǎo)入為數(shù)據(jù)”。圖2-6Excel文件數(shù)據(jù)導(dǎo)入選擇窗口數(shù)據(jù)錄入4.Stata命令導(dǎo)入實際上,上面三種方式在實際操作中都很少使用,我們通常習(xí)慣在Do-file文件中輸入并運行命令,達到將數(shù)據(jù)導(dǎo)入的目的。導(dǎo)入數(shù)據(jù)的Stata命令有很多,由于篇幅限制,在這里我們只介紹最常用的幾種,其余命令在后面的章節(jié)中會陸續(xù)出現(xiàn)。方法1:input。這個命令一般用于手動輸入數(shù)據(jù),這種方法其實在Stata軟件中并不常用,格式如下-clear-inputyearGDPCONS199019067.012001.4199122124.213614.2 199227334.216225.2-end圖2-7查看數(shù)據(jù)集點擊工具欄中
的圖標(biāo),或者在Do-file文件中運行“browse”命令,可以查看輸入的數(shù)據(jù)集,數(shù)據(jù)集如圖2-7所示。數(shù)據(jù)錄入方法2:import。這個命令功能非常強大,可以導(dǎo)入幾乎所有格式的數(shù)據(jù),是最常用的導(dǎo)入命令,格式如下-importexcel"C:\Users\Lenovo\Stata1.xls"運行上述命令,即可導(dǎo)入存儲在“C:\Users\Lenovo\”中的Excel文件Stata1.xls。如果想把Excel文件中的第一行轉(zhuǎn)變成變量名,可以借助命令“firstrow”實現(xiàn),格式如下-importexcel"C:\Users\Lenovo\Stata1.xls",firstrow數(shù)據(jù)錄入除了上面著重介紹的兩個命令,Stata軟件中還有許多其他的命令可以用于輸入數(shù)據(jù)的,它們的功能特點如表2-1所示。命令功能use讀取Stata格式的文件insheet讀取tab分隔的文本文件infile讀取txt格式的文件xmluse讀取xml格式的文件表2-1Stata輸入數(shù)據(jù)命令數(shù)據(jù)存儲在Stata軟件中最常用的數(shù)據(jù)存儲命令是“save”,格式如下-clear-inputyearGDPCONS199019067.012001.4199122124.213614.2 199227334.216225.2-end-saveStata1.dta,replace//保存數(shù)據(jù)-useStata1.dta,clear//調(diào)入數(shù)據(jù)值得注意的是,在Stata軟件中多個數(shù)據(jù)庫不能同時運行,所以在調(diào)入一個新的數(shù)據(jù)庫之前必須要先清理之前運行的數(shù)據(jù)庫,清理命令是“clear”。數(shù)據(jù)存儲此外,Stata軟件中還有許多其他的命令可以用于導(dǎo)出存儲數(shù)據(jù),它們的功能特點如表2-2所示。命令功能outsheet導(dǎo)出為tab分隔的文本文件outfile導(dǎo)出為txt格式的文件xmlsave導(dǎo)出為xml格式的文件表2-2Stata存儲數(shù)據(jù)命令03數(shù)據(jù)處理1.drop這個命令用于刪除變量,格式如下:-useauto.dta,clear//調(diào)用auto.dta數(shù)據(jù)庫(這是Stata軟件自帶的數(shù)據(jù)庫)-dropmpgmpg1//刪除變量mpg2.keep這個命令用于保留需要的數(shù)據(jù),格式如下:-useauto.dta,clear-keepifprice>=4000//保留變量price的值大于或等于4000的數(shù)據(jù)上述操作也可以借助“drop”命令完成,格式如下:-useauto.dta,clear-dropifprice<4000//刪除變量price的值小于4000的數(shù)據(jù)刪除數(shù)據(jù)和生成變量刪除數(shù)據(jù)和生成變量3.generate這個命令用于創(chuàng)建新變量,格式如下-useauto.dta,clear
-generatelnY=log(price)//新建變量lnY,取值為變量price的自然對數(shù)“generate”是一個很好用的命令,借助它可以很方便地對已有的變量或序列進行變換。這里涉及到變量的命名,Stata軟件中的變量名的設(shè)置規(guī)則如下:(1)由英文字母、數(shù)字或_組成,至多不超過32個;(2)首字母必須為字母或_;(3)英文字母的大寫和小寫具有不同的含義。1.rename這個命令用于給變量重命名,格式如下:-useauto.dta,clear
-renamempgmpg1//將變量mpg重命名為mpg12.lable這個命令通常用于給數(shù)據(jù)庫和變量添加標(biāo)簽,格式如下:如下-useauto.dta,clear-labeldata"1978汽車調(diào)查數(shù)據(jù)"http://給數(shù)據(jù)庫添加標(biāo)簽"1978汽車調(diào)查數(shù)據(jù)"-labelvariablerep78"修理"http://給變量rep78添加標(biāo)簽"修理"修改數(shù)據(jù)5.recode這個命令用于更改變量的值,格式如下:-useauto.dta,clear-recoderep78(.=1)//將變量rep78中為“.”的值替換為1除此之外,使用命令“replace”也可以達到相同的效果,不過命令格式稍有不同,格式如下:-useauto.dta,clear-replacerep78=1ifrep78==.3.order這個命令用于給變量排序,格式如下:-useauto.dta,clear
-order_all,alphabetic//將所有變量按照字母表順序排序-ordermpg,before(price)//將變量mpg移動到變量price前面-orderrep78pricempg//將變量rep78、price、mpg按順序移動到所有變量前除了命令“order”外,命令“move”也可以用于給變量排序,格式如下:如下-useauto.dta,clear
-movempgprice//將變量mpg移動到變量price前面4.sort這個命令的功能也是排序,不過和上面兩個命令不同的是,“sort”用于給數(shù)據(jù)排序,格式如下:-useauto.dta,clear-sortmpg//根據(jù)變量mpg的取值按從小到大的順序排序修改數(shù)據(jù)1.list這個命令用于列示變量中的數(shù)值,格式如下:-useauto.dta,clearlistprice//列表顯示變量price的值如果只需要查看一部分值,可以在命令后加限定條件,運行結(jié)果如圖2-8所示,格式如下:-useauto.dta,clear-listpricein1/8//列表顯示變量price中前8個值描述數(shù)據(jù)圖2-8變量price的前8個取值2.count這個命令用于統(tǒng)計數(shù)據(jù)集中有效數(shù)值的個數(shù),格式如下:-useauto.dta,clear-count可以通過附加限定條件統(tǒng)計特定數(shù)值的個數(shù),例如:-useauto.dta,clear-countifprice<4000//統(tǒng)計變量price小于4000的個數(shù)3.tabulate這個命令用于列表描述變量的基本統(tǒng)計特征,運行結(jié)果如圖2-9所示,格式如下:-useauto.dta,clear-tabulaterep78描述數(shù)據(jù)圖2-9基本統(tǒng)計特征其中,第一列為變量rep78的取值,頻數(shù)(Freq)列為各個數(shù)值出現(xiàn)的次數(shù),頻率(Percent)為各個數(shù)值出現(xiàn)的頻率,累計(Cum)列為本行及之前數(shù)值出現(xiàn)的頻率。從以上運行結(jié)果可以看出,變量r78共有69個值,取值為2的數(shù)據(jù)有8個,在所有數(shù)據(jù)中占比11.59%,取值1或2的比率為14.49%。4.tabstat命令“tabstat”和命令“tabulate”拼寫相似,但作用不同,運行該命令后列表輸出的是變量的概要統(tǒng)計指標(biāo),運行結(jié)果如圖2-10所示,格式如下:-useauto.dta,clear-tabstatrep78描述數(shù)據(jù)圖2-10概要統(tǒng)計指標(biāo)1
從運行結(jié)果可以看出,變量rep78的平均值是3.41??梢酝ㄟ^附加命令,來得到更為詳細的輸出結(jié)果,運行結(jié)果如圖2-11所示,格式如下-useauto.dta,clear-tabstatrep78,stat(meansdp50minmax)圖2-11概要統(tǒng)計指標(biāo)2
從結(jié)果可以看出,變量rep78的平均值是3.41,標(biāo)準(zhǔn)差是0.99,中位數(shù)是3,最小值是1,最大值是5。4.tabstat命令“tabstat”和命令“tabulate”拼寫相似,但作用不同,運行該命令后列表輸出的是變量的概要統(tǒng)計指標(biāo),運行結(jié)果如圖2-10所示,格式如下:-useauto.dta,clear-tabstatrep78描述數(shù)據(jù)
此外,還可以根據(jù)其他變量的取值對變量rep78進行分組,分別求變量rep78的概要統(tǒng)計指標(biāo),格式如下-useauto.dta,clear-tabstatrep78,by(foreign)stat(meansdmedminmax)圖2-12分組概要統(tǒng)計指標(biāo)
圖2-12顯示的是按照變量foreign的數(shù)據(jù)分組求變量rep78的概要統(tǒng)計指標(biāo),從運行結(jié)果可以看到,國內(nèi)車輛修理的平均次數(shù)是3.02,外國車輛修理的平均次數(shù)是4.29。5.summarize這個命令用于列表輸出變量的描述性統(tǒng)計結(jié)果,運行結(jié)果如圖2-13所示,格式如下:-useauto.dta,clear-summarizerep78描述數(shù)據(jù)
運行結(jié)果和圖2-11相似,不同的是它多了一個有效值個數(shù),有效值的意思是不為空格或“.”。如果想要得到更加詳細的描述性統(tǒng)計結(jié)果,可以運行如下操作命令,運行結(jié)果如2-14所示-useauto.dta,clear-summarizerep78,detail圖2-13描述性統(tǒng)計結(jié)果5.summarize這個命令用于列表輸出變量的描述性統(tǒng)計結(jié)果,運行結(jié)果如圖2-13所示,格式如下:-useauto.dta,clear-summarizerep78描述數(shù)據(jù)圖2-14描述性統(tǒng)計結(jié)果2
從圖2-14所示的運行結(jié)果可以得到更多信息:最左邊兩列顯示的是百分位數(shù),例如變量rep78的第一個四分位數(shù)(25%)是3;中間列顯示的是變量rep78的四個最小值和四個最大值,即變量rep78中最小的四個數(shù)據(jù)分別為1、1、2、2,最大的四個數(shù)據(jù)分別為5、5、5、5;變量rep78的方差(Variance)為0.98,偏度(Skewness)為-0.06,峰度(Kurtosis)為2.68。6.describe這個命令用于描述變量的整體特征,運行結(jié)果如圖2-15所示,格式如下:如下-useauto.dta,clear-desrep78描述數(shù)據(jù)圖2-15整體特征
從運行結(jié)果可以看出,變量rep78的變量名(variablename)為rep78,存儲類型(storagetype)為整數(shù)型(int),顯示格式為(displayformat)為8位、精確到個位數(shù),沒有值標(biāo)簽(valuelabel),變量標(biāo)簽(variablelabel)為“美國1978年汽車維修記錄(RepairRecord1978)”。7.correlate這個命令用于求變量間的相關(guān)系數(shù),運行結(jié)果如圖2-16所示,格式如下:-importexcel“C:/Users/Lenovo/Stata1-5.xls",firstrow//導(dǎo)入如圖1-5所示的數(shù)據(jù)-correlateXY描述數(shù)據(jù)圖2-16相關(guān)系數(shù)矩陣添加附加命令可以得到變量間的方差-協(xié)方差系數(shù)矩陣,運行結(jié)果如圖2-17所示,格式如下-importexcel"C:\Users\Lenovo\Stata1-5.xls",firstrow
-correlateXY,c圖2-17方差-協(xié)方差系數(shù)矩陣04繪制圖形繪制圖形假定我國居民人均消費水平和人均GDP如表2-3所示,借助表2-3中的數(shù)據(jù),本節(jié)主要介紹在Stata軟件中繪制直方圖、散點圖和曲線圖的命令。表2-3我國人均居民消費水平和人均GDP單位:元/人資料來源:國泰安CSMAR數(shù)據(jù)庫()
這個命令用于繪制直方圖,運行結(jié)果如圖2-18所示,格式如下:如下-clear-importexcel"C:\Users\Lenovo\Stata2-3.xls",firstrow-histGDP,frequency1.histogram繪制圖形圖2-18直方圖
在圖2-18中,橫軸表示GDP的取值范圍,縱軸表示頻數(shù),可以點擊“File/startgrapheditor”對生成的圖形進行更加個性化的修改。這個命令用于繪制散點圖,運行結(jié)果如圖2-19所示,格式如下:-clear-importexcel"C:\Users\Lenovo\Stata2-3.xls",firstrow-graphtwowayscatterCGDP值得注意的是,在Stata軟件中繪制散點圖時,應(yīng)當(dāng)先輸入因變量,再輸入自變量,這和Eviews軟件中選擇變量的順序恰好相反。2.scatter繪制圖形圖2-19散點圖這個命令用于用于繪制曲線圖,運行結(jié)果如圖2-20所示,格式如下:如下-clear-importexcel"C:\Users\Lenovo\Stata2-3.xls",firstrow-graphtwowaylineCGDP3.line繪制圖形圖2-20曲線圖這個命令用于用于繪制帶數(shù)據(jù)標(biāo)記的曲線圖,運行結(jié)果如圖2-21所示,格式如下:如下-clear-importexcel"C:\Users\Lenovo\Stata2-3.xls",firstrow-graphtwowayconnectedCGDP4.connected繪制圖形圖2-21帶數(shù)據(jù)標(biāo)記的曲線圖05其他命令1.help使用這個命令可以很方便地了解并掌握Stata軟件中一些我們不熟悉的程序命令和操作,例如我們知道某個命令的名
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 交警應(yīng)急演練方案(3篇)
- 培訓(xùn)機構(gòu)監(jiān)督訓(xùn)練方案(3篇)
- 公寓失火自救措施方案(3篇)
- 海鮮泡沫包裝采購方案(3篇)
- 銀行項目貸款方案(3篇)
- 鄉(xiāng)村別墅租售方案(3篇)
- 復(fù)式吊樓建造方案(3篇)
- 廢水處置自控方案(3篇)
- 幽幽戀鄉(xiāng)情800字9篇
- 企業(yè)印章制作及使用協(xié)議
- 雙方簽定協(xié)議書
- 2024-2025學(xué)年八年級數(shù)學(xué)下冊期末培優(yōu)卷(北師大版)含答案
- 2025福建福州市鼓樓區(qū)國有資產(chǎn)投資發(fā)展集團有限公司副總經(jīng)理公開招聘1人筆試參考題庫附帶答案詳解(10套)
- 2025年12345熱線考試題庫
- 多余物控制管理辦法
- GB/T 3452.2-1987O形橡膠密封圈外觀質(zhì)量檢驗標(biāo)準(zhǔn)
- GB/T 1690-1992硫化橡膠耐液體試驗方法
- 叉車隱患排查情況記錄表
- he及roma用于卵巢癌全程管理省腫瘤雷旦生
- 小兒呼吸機相關(guān)知識詳解課件
- 維護手冊v00-地鐵3號線貫通道系統(tǒng)
評論
0/150
提交評論