




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二講:內生的解釋變量與工具變量法第二講:1單方程線性模型?如果我們在經驗分析中采用一個單方程線
性模型來研究x對y的影響,并得到相關的
政策結論,那么則要求方程y
=
0
+
1X1
+
2X2
+
.
.
.
kXk
+
u能夠反映X與y之間的因果關系,而不是單純的統(tǒng)計相關關系單方程線性模型?如果我們在經驗分析中采用一個單方程線y2假設1?條件期望線性與外生性假設y
=E(y|X)+u=
0
+
1X1
+
2X2
+
.
.
.
kXk
+
u?定義:u
=
y?E(y|X),則假設1意味E(u|X)=0,這又成為X嚴格外生性的假設–如果E(u|X)=0成立,線性模型就能夠解釋x與y之間的因果關系,并成為結構模型–同時E(u|X)=0是E(X’u)=0的充分條件,E(X’u)=0是OLS估計的依據(jù)。–E(u|X)=0還意味著Cov(X,u)=0假設1?條件期望線性與外生性假設y=E(y|X)+3假設2?樣本矩陣滿列秩rank(X)=K<n?含義–要求有足夠多的觀測值,n>k–變量之間不存在線性組合–保證X‘X可逆,滿秩,非奇異,從而估計結果唯一假設2?樣本矩陣滿列秩rank(X)=K<n?含義–4假設3?隨機擾動項同方差、無自相關Var(y|X)=2I?含義–y的條件方差為純量協(xié)方差矩陣–由于2為常數(shù),與x無關,所以條件方差等價于無條件方差–該假設等價于Var(u|X)=2,即同方差Var(ui)=2,無序列相關Cov(ui,uj)=0假設3?隨機擾動項同方差、無自相關Var(y|X)=25假設4?(yi,xi)為隨機樣本,i=1,2,?,n假設4?(yi,xi)為隨機樣本,i=1,2,?,n6對模型假設的討論?線性條件期望不成立的情形E(y|X)≠X’,E(u|X)≠0?來源–模型設定的錯誤misspecification–變量的誤差–聯(lián)立性對模型假設的討論?線性條件期望不成立的情形E(y|X)≠7模型的設定錯誤?函數(shù)形式的錯誤–非參數(shù)設定來解決?包含了多余變量–如果多加的變量與其它的解釋變量無關,OLS估計仍然是無偏,一致,但不有效–如果多加的變量與其它的解釋變量有關,OLS估計有偏–例:研究新生兒體重y與母親在孕期的食品攝入量x的關系,如果考慮家庭收入z。正確的模型設定為:
E(y|x,z)=x。如果加入z,模型變?yōu)镋(y|x,z)=?x+γz如果z與x無關,則β?=β,但通常的情況下,z與x相關,從而?≠模型的設定錯誤?函數(shù)形式的錯誤–非參數(shù)設定來解決?8?遺漏變量–被遺漏的變量q進入到隨機擾動項中,
u=rq+v,OLS估計不一致,教材P63例?解決的辦法–代理變量–工具變量法–paneldata?遺漏變量–被遺漏的變量q進入到隨機擾動項中,?解9?教育回報的例子
–正確的模型設定
log(wage)=0+1exp+2exp2+3edu+abil+v
–能力ability通常觀察不到,成為遺漏變量,模型
成為
log(wage)=0+1exp+2exp2+3edu+u–通常ability受到教育的影響abil=?+?edu+r,
E(r|exp,exp2)=0–從而E(b3)=3+3,b3不僅是有偏的,而且在大
樣本中也是不一致的。–特別是,如果3>0,b3會高估教育對工資的影響?教育回報的例子–通常ability受到教育的影響a10變量的測量誤差?被解釋變量的測量誤差?真實的模型設定y*=X’+u?y*沒有被準確觀察到,觀察到的是y–y=y*+v,v為測量誤差–模型變?yōu)椋簓=X’+u+v–如果E(v|X)=0,假設1沒有被破壞–如果E(v|X)≠0,假設1不成立,OLS有偏且不一致變量的測量誤差?被解釋變量的測量誤差y*=X’+u?11?解釋變量的測量誤差?真實的模型設定y=X’β+z*+u–z*含有測量誤差,觀察到
z=z*+v,E(z|x,z*)=z*,–實際的回歸方程為:y=X’+z+(u-v)=X’+z+ε–這時,由于ε=u-v與z=z*+v相關,所以E(ε|X,z)≠0,假設1不成立?解釋變量的測量誤差y=X’β+z*+u–z*含有測12聯(lián)立性?所謂聯(lián)立性是指,兩個變量之間的因果關系不是單方向的,它們之間相互影響?在單方程模型中,如果至少一個解釋變量
同時由被解釋變量y部分決定,模型就出現(xiàn)
了聯(lián)立性問題?聯(lián)立性問題很多情況下,是由于變量遺漏造成的。?在出現(xiàn)聯(lián)立性的模型中,E(u|X)≠0聯(lián)立性?所謂聯(lián)立性是指,兩個變量之間的因果關系不是單方向13解釋變量的外生性? 解釋變量外生性是古典線性回歸模型的一個基本假定,也是保證線性模型成為結構模型的前提? 該假定的基本內容是指擾動項關于解釋變量的條件期望等于零:E(u|X)=0–解釋變量X產生機制與隨機擾動項u無關–可以推出:Cov(Xjk,ui)=0和E(x′ku)=0–大樣本條件下的漸進無關性:解釋變量的外生性? 解釋變量外生性是古典線性回歸模型的一個14一個說明? E(x′ku)=0表示Xk與u在小樣本情形下無關可能成立,即在大樣本條件下,Xk與u滿足漸近無關性。此時,OLS估計量仍然能夠保持良好的大樣本性質? 但是當E(x′ku)≠0時,
仍然有一個說明? E(x′ku)=0表示Xk與u在小樣本情15內生解釋變量的產生? 內生解釋變量產生的原因基本上可以分為四種:–遺漏變量–觀測誤差–聯(lián)立偏差–樣本選擇問題(sampleselection)內生解釋變量的產生? 內生解釋變量產生的原因基本上可以分為16遺漏變量? 當被遺漏的變量與引入模型的其他解釋變量相關,被遺漏的變量進入到隨機擾動項時,就會導致解釋變量與擾動項相關? 假定真實的總體模型設定為:Y=Xβ+Wγ+u? 但是由于不可觀察的原因,我們無法得到W的數(shù)據(jù),這樣回歸模型就成為:Y=Xβ+ε ,其中ε=Wγ+u? 如果X中的某個或某幾個解釋變量,如Xk與W相關,就將導致Cov(xk,ε)≠0,從而出現(xiàn)內生的解釋變量問題遺漏變量? 當被遺漏的變量與引入模型的其他解釋變量相關,被17觀測誤差? 不論是通過現(xiàn)場調查還是二手數(shù)據(jù),我們都不可能避免“觀測誤差”問題? 當觀測誤差進入到隨機擾動項中,并與某個或某些解釋變量相關時,就出現(xiàn)了內生解釋變量–在收入調查中,被訪者的報告誤差常常與被訪者的年齡呈現(xiàn)某種關系,即年齡越小,誤差可能越大? 即使觀測誤差與隨機擾動項無關,新的隨機擾動項仍然會與解釋變量相關觀測誤差? 不論是通過現(xiàn)場調查還是二手數(shù)據(jù),我們都不可能避18聯(lián)立偏差? 當X和Y相互作用,相互影響,互為因果時,我們應該用聯(lián)立方程組的形式來描述它們之間的關系? 但如果我們仍然采用單一線性方程形式,以Y為被解釋變量,X為解釋變量,就會導致與擾動項相關的情況出現(xiàn),X成為內生的解釋變量聯(lián)立偏差? 當X和Y相互作用,相互影響,互為因果時,我們應19樣本選擇? 樣本選擇指的是我們所觀察的被解釋變量的結果,部分地受到行為主體對是否參與某項活動選擇的影響,從而導致我們所得到的樣本成為非隨機的樣本–舉例而言,在研究個人健康對于醫(yī)療保險保費的影響這一問題中,由于我們只能夠觀察到投保人的保費和他們的個人信息,而無法得到沒有投保的消費者相關信息,從而使得個人健康這一變量具有內生性–具體而言,投保人的個人健康狀況一般稍差,并愿意支付更高的保費樣本選擇? 樣本選擇指的是我們所觀察的被解釋變量的結果,部20內生解釋變量的影響計量b不一致? 當E(u|X)≠0時,OLS估計量b有偏且不一致? 在大樣本條件下,當,OLS估內生解釋變量的影響計量b不一致? 當E(u|X)≠021內生解釋變量的探查? 怎樣判斷模型的解釋變量中出現(xiàn)了與隨機擾動項相關的情形,并沒有現(xiàn)成的檢驗方法? 當我們找到足夠多的工具變量時,可以對疑似內生的解釋變量進行檢驗? 除了統(tǒng)計上的檢驗之外,我們可以根據(jù)上述內生解釋變量產生的原因,即遺漏變量、觀測誤差、聯(lián)立偏差、樣本選擇與經濟理論、所研究的具體問題結合起來,判斷回歸模型中是否出現(xiàn)了解釋變量的內生性內生解釋變量的探查? 怎樣判斷模型的解釋變量中出現(xiàn)了與隨機擾22? 例如,外商直接投資(FDI)技術溢出效應? 經驗分析中通常都是以行業(yè)/企業(yè)產出水平或勞動生產率作為被解釋變量,通過該變量對于FDI的回歸系數(shù)的符號、大小以及顯著程度,來判斷FDI對于引入外資的行業(yè)/企業(yè)業(yè)績變化的實際影響? 由于FDI的進入與外資引入國本身的要素稟賦、技術水平、勞動力狀況以及經濟發(fā)展水平密切相關,因此FDI與行業(yè)/產出水平相互影響,使之成為具有內生性的解釋變量,人們可能會在溢出效應并沒有發(fā)生的情況下,把生產效率的提高歸因于外資企業(yè)的溢出作用,從而在單方程的計量分析中產生聯(lián)立偏差? 例如,外商直接投資(FDI)技術溢出效應23工具變量法? 工具變量的定義? 工具變量法? IV估計量的統(tǒng)計性質兩階段最小二乘法(2StageLeastSquare)? 工具變量的選擇? 對內生性的簡單檢驗工具變量法? 工具變量的定義24? Xk為內生的解釋變量? 假定我們可以把Xk分解為兩個部分,一部分與隨機擾動項u相關,另一部分與u無關? 如果我們能夠找到另一個變量或多個變量Z,它與Xk相關,但與u無關,就可以通過Z將Xk中與u無關的部分分離出來,從而識別出Xk對y的邊際影響,這個結果具有一致性這種方法稱為工具變量法(InstrumentalVariablesMethod,簡稱IV法)? Xk為內生的解釋變量25y
=
0
+
1X1
+
2X2
+
.
.
.
kXk
+
uy
=
0
+
1
1
+
2X2
+
.
.
.
kXk
+
u
X1=
a0
+
a1Z
+
a2X2
+
.
.
.
akXk
+
v原方程:新方程(工具變量):主回歸:輔助回歸:y=0+1X1+2X2+...26工具變量的定義? 在K變量線性回歸模型中,不妨假定解釋變量XK具有內生性,即E(u|XK)≠0,或E(x′Ku)≠0,或
如果變量Z1,Z2,…,ZL,L≥K,滿足下面兩個條件,則稱為工具變量:工具變量的定義? 在K變量線性回歸模型中,不妨假定解釋變量27條件1:工具相關性? 該條件要求r[E(Z′X)]=K在大樣本條件下,上式還可表述為? 條件1該條件要求工具變量與解釋變量相關,但在實際中,僅僅相關是不夠的,只有在高度相關的條件下,IV估計結果才具有良好的大樣本性質∑zx 滿列秩,即行列式≠0條件1:工具相關性? 該條件要求? 條件1該條件要求工具變量28弱工具變量? 與解釋變量之間的相關關系很弱的工具變量被稱為“弱工具變量”? 運用弱工具變量,IV估計結果不僅具有很低的估計精度和很大的方差,而且會放大變量遺漏的偏差? 同時,在大樣本的條件下,IV估計量的漸進正態(tài)性將不會出現(xiàn)。弱工具變量? 與解釋變量之間的相關關系很弱的工具變量被稱為29條件2.工具外生性? 該條件要求E(Z′u)=0? 上式表明,Z與u無關,Z具有外生性? 在大樣本條件下,上式還可表述為? 由于u不可觀測,這個條件在理論上是不可檢驗的,但在現(xiàn)實中,當滿足某些條件時,可以進行事后檢驗條件2.工具外生性? 該條件要求? 由于u不可觀測,這個條件30例? 假定解釋變量Xk具有內生性,找到Z=(X1,X2,…
,XK?1,ZK)只要Cov(ZK,XK)≠0,Cov(ZK,ε)=0變量Z就滿足條件1和2,成為工具變量? 實際運用中,尋找工具變量的關鍵就是要找到與Xk高度相關而與u無關的Zk例31識別? 恰好識別–回歸模型中有一個解釋變量是內生的,而我們就找到一個工具變量–內生的解釋變量個數(shù)與工具變量的個數(shù)相等? 不可識別–內生的解釋變量個數(shù)大于工具變量的個數(shù),我們無法估計回歸參數(shù)? 過度識別–工具變量的個數(shù)更多–只有在這種情形下,我們才能夠對工具變量的外生性進行檢驗識別? 恰好識別–回歸模型中有一個解釋變量是內生的,而我們32討論:教育回報率研究中的IV? 內生的解釋變量:教育水平或年限? 被解釋變量:個人收入或工資水平? 文獻中使用的工具變量–父母的教育水平–家庭收入–同胞的教育水平–18歲時家庭所在地的藍領工資、失業(yè)率–家庭住址距離大學校區(qū)的距離–相關的義務教育法規(guī)討論:教育回報率研究中的IV? 內生的解釋變量:教育水平或年33IV估計量bIV的統(tǒng)計性質? IV估計量在有限樣本的條件下表現(xiàn)并不理想–通常是有偏的–此時的IV估計量可能不滿足矩條件? 在大樣本條件下,IV估計量將擁有良好的性質,因此下面就只討論的大樣本性質IV估計量bIV的統(tǒng)計性質? IV估計量在有限樣本的條件下表34兩階段最小二乘法? 原理和步驟? 實際操作? 2SLS估計量的性質兩階段最小二乘法? 原理和步驟35原理和步驟? 回歸模型Y =Xβ+u? 假定解釋變量XK具有內生性? 找到XK的M個工具變量:Z1,Z2,…
,ZM? 如果我們分別運用這M個工具變量對β進行估計,我們將得到M個工具變量估計結果? 但是,如果我們在一次回歸中運用這M個工具變量,將會得到最好的估計結果,這個方法就是兩階段最小二乘法原理和步驟? 回歸模型Y =Xβ+u36
372SLS具體步驟? 以XK為因變量,對X1,X2,…
,XK?1,Z1,…,ZM進行OLS回歸,得到擬合值–
是其它外生的解釋變量以及M個工具變量的線性組合–根據(jù)假定和工具變量的定義,
中的每個因子都與隨機擾動項無關,因此
也與u無關–同時,
是XK的擬合值,因此它又與XK高度相關2SLS具體步驟? 以XK為因變量,對X1,X2,…38? 以y為因變量,對回歸? 得到:X1,X2,…,XK?1,
進行OLS? 以y為因變量,對回歸X1,X2,…,XK39實際操作ivregressestimatordepvar
[varlist1](varlist2=varlist_iv)[if][in][weight][,options](Stata10,之前的版本命令為ivregestimator2slstwo-stageleastsquares(2SLS)limllimited-informationmaximumlikelihood(LIML)gmmgeneralizedmethodofmoments(GMM)實際操作ivregressestimatordepvar40例ivregyG1G2G3(X=Z),first–the“first”optionprovidesyouwiththefirststageresultsivregyG1G2G3(X=Z1Z2),first–Ifyou’vegotmorethan1instrumentforeachendogenousindependentvariable例ivregyG1G2G3(X=Z),fir412SLS估計量的性質? 2SLS估計量除了具有一般工具變量估計量所具有的一致性和漸近正態(tài)性之外,當隨機擾動項滿足同方差的假定時,給定一組工具變量,2SLS估計量將是其中最有效的估計量,這個性質稱為2SLS估計量的相對有效性? 證明見教材96-97頁2SLS估計量的性質? 2SLS估計量除了具有一般工具變量估42工具變量的選擇? IV方法運用的結果取決于工具變量的有效性? 而該有效性又取決于工具變量本身與內生的解釋變量之間的相關性以及它與隨機擾動項之間的獨立性工具變量的選擇? IV方法運用的結果取決于工具變量的有效性43Z與XK的相關性? Z與XK的相關性越強,根據(jù)正態(tài)分布所進行的統(tǒng)計推斷的可靠性就越高? 一個好的工具變量,首先要看它是否與XK存在很強的相關性? 計量經濟學家建議可以對2SLS程序中的第一階段的回歸方程進行回歸系數(shù)的總體顯著性檢驗,來判斷Z與XK是否具有很強的相關性Bound,JaegerandBaker(1995)–如果F值小于10,則認為Z為弱的工具變量Z與XK的相關性? Z與XK的相關性越強,根據(jù)正態(tài)分布所進行44Z的外生性? 如果在IV估計中,我們使用了非外生的工具變量,即Z與隨機擾動項u相關,IV估計量將是不一致的? 在“過度識別”的情形下,我們才可以對Z的外生性進行檢驗Sagan檢驗–用原模型的IV估計的殘差e對其它外生的解釋變量和工具變量進行回歸,得到擬合優(yōu)度R2。–Sagan統(tǒng)計量(n?K)R2~χ2(M?1)aZ的外生性? 如果在IV估計中,我們使用了非外生的工具變量45對XK內生性的簡單檢驗Hausman設定檢驗–如果XK不具有內生性,IV估計結果與OLS估計結果沒有顯著的差異? 步驟–用XK對其他外生的解釋變量和工具變量進行OLS回歸,得到殘差v–建立回歸方程:Y=Xβ+γv+u–檢驗γ的顯著性?如果不顯著,表明XK不具有內生性對XK內生性的簡單檢驗Hausman設定檢驗46工具變量選取示例:工具變量選取示例:47工具變量選取示例:工具變量選取示例:48一個例子:JoshuaAngrist(1990)? WhyDoWorldWarIIVeteransEarnMoreThanNonveterans?作者在這篇文章中分析了美國二戰(zhàn)老兵的入伍經歷對他們日后工資的影響工資方程:lnW=Vβ
+Xδ
+Yiαi
+ε– W:男性的工資– V
:他是否在二戰(zhàn)期間服過兵役– X
:控制變量組– Yi
:出生年份虛擬變量– ε:隨機誤差項一個例子:JoshuaAngrist(1990)? Wh49第2講-工具變量法ppt課件50? 如果我們用OLS方法對上面的工資方程進行估計的話,真實的參數(shù)α很可能被低估? 這是因為在美國志愿兵的體制下,應召入伍的樣本不是一個隨機樣本–人們作出是否參軍的決定是一個“自我選擇”的過程,這個過程受到很多觀察不到的因素的影響–特別是,這些因素也同時對他們的工資水平產生影響–一般而言,那些在工作市場上機會不多、工資微薄的人更可能會選擇服兵役,因此成為一個具有內生性的解釋變量? 如果我們用OLS方法對上面的工資方程進行估計的話,真實51尋找工具變量? 這個工具變量必須滿足:? (1)工具的相關性,即它應該與個人的服兵役狀態(tài)相關;? (2)工具的外生性,即它本身并不決定個人的工資水平,同時也不與其他決定工資水平的因素相關。尋找工具變量? 這個工具變量必須滿足:52“抽簽”征兵制度? 1942年,為了擴軍的需要,美國政府在“志愿兵”制度的基礎上,推行了“抽簽”的強制征兵制度? 根據(jù)該制度,365天中的每一天被賦予一個隨機選擇號碼(RandomSelectionNumber,RSN),這樣每位19~26歲合格役男按照生日被分配一個相對應的RSN? 美國國防部根據(jù)征兵人數(shù)的需要,公布一個門檻號碼(在那一年,這個號碼是195),RSN小于門檻號碼的役男將應征入伍?!俺楹灐闭鞅贫? 1942年,為了擴軍的需要,美國政府在53? 在Angrist的研究中,這個制度的實行被當作了一次“自然實驗”–Angrist將RSN是否小于門檻號碼這一虛擬變量作為兵役狀態(tài)的工具變量–由于RSN與門檻號碼的大小關系決定了每位役男是否入伍的狀態(tài),RSN越小,入伍的可能性越大,RSN越大,入伍的可能性越低,因此它與有著很強的相關性–但同時RSN是一個隨機號碼,它本身與工資水平無關,因此滿足工具的外生性要求,是一個有效的工具變量? 在Angrist的研究中,這個制度的實行被當作了一次“54第2講-工具變量法ppt課件55– Z:工具變量“出生季度,以及出生季度與出生年份的乘積交互項”Z=(Q1,Q2,Q3,Q1*Y1926,…,Q3*Y1928)工具變量回歸方程:– Z:工具變量“出生季度,以及出生季度與出生年份的乘積交互56BasicResultsontheReturntoWorldWa
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025房地產開發(fā)合同
- 2025-2030中國土地資源資產核算理論與方法研究報告
- 2025-2030中國土地整治項目投融資模式創(chuàng)新案例研究
- 2025-2030中國土地市場債券發(fā)行與信用評級分析報告
- 2025-2030中國土地勘測定界技術標準升級與數(shù)字化轉型研究
- 高壓線路帶電檢修工技能試題附
- 2025-2030中國縣域物流園區(qū)商業(yè)模式創(chuàng)新與縣域經濟聯(lián)動研究
- 2025-2030中國化工產業(yè)市場發(fā)展分析及前景趨勢與投資機會風險研究報告
- 醫(yī)院廢物管理培訓課件
- 2025年建筑工程合同樣本
- 海上風力發(fā)電項目可行性研究報告
- 2025-2030中國吡咯并喹啉醌行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展研究報告
- 大疆無人機在農業(yè)領域的創(chuàng)新應用
- 2025年鈑金加工項目發(fā)展計劃
- 礦山職業(yè)健康培訓
- DG-TJ08-2170-2015 城市軌道交通結構監(jiān)護測量規(guī)范
- 2025年度簽約主播與短視頻平臺合作協(xié)議
- 物理-江西省九江市2025屆高三第一次高考模擬統(tǒng)一考試(九江一模)試題和答案
- 數(shù)據(jù)管理知識培訓課件
- 人文醫(yī)學課件
- 中華人民共和國建筑法
評論
0/150
提交評論