來源:本文授權轉載自數(shù)量經(jīng)濟學 本文包括靜態(tài)與動態(tài)面板數(shù)據(jù)處理方法,包含hausman檢驗,固定效應檢驗,隨機效應檢驗,異方差檢驗、相關檢驗,面板logit與面板probit模型、面板泊松模型、面板負二項模型等眾多干貨內(nèi)容,歡迎閱讀。 本文目錄 一、靜態(tài)面板數(shù)據(jù) ●數(shù)據(jù)處理 ●模型的篩選和檢驗 1、檢驗個體效應(混合效應還是固定效應) 2、檢驗時間效應(混合效應還是隨機效應) 3、檢驗固定效應模型or隨機效應模型 (檢驗方法:Hausman檢驗) ●模型的篩選和檢驗 1、固定效應估計 2、隨機效應估計省略 3、時間固定效應(以上分析主要針對的是個體效應) ●異方差和自相關檢驗 1、異方差檢驗 (組間異方差) 2、序列相關檢驗 3、“異方差—序列相關”穩(wěn)健型標準誤 4、截面相關檢驗 5、“異方差—序列相關—截面相關”穩(wěn)健型標準誤 二、動態(tài)面板數(shù)據(jù) 三、面板logit與面板probit模型 四、面板泊松模型 五、面板負二項模型 六、面板Tobit模型 七、面板工具變量法 八、面板隨機前沿模型 一.靜態(tài)面板數(shù)據(jù)的STATA處理命令 (一)數(shù)據(jù)處理 輸入數(shù)據(jù) use 'E:\stata\data\FDI.dta', clear tsset code year 該命令是將數(shù)據(jù)定義為“面板”形式 xtdes 該命令是了解面板數(shù)據(jù)結構 summarize lngdp lnfdi lnie lnex lnim lnci lngp 各變量的描述性統(tǒng)計(統(tǒng)計分析) 拓展命令: gen lag_y=L.y 產(chǎn)生一個滯后一期的新變量 gen F_y=F.y 產(chǎn)生一個超前項的新變量 gen D_y=D.y 產(chǎn)生一個一階差分的新變量 gen D2_y=D2.y 產(chǎn)生一個二階差分的新變量 (二)模型的篩選和檢驗 1、檢驗個體效應(混合效應還是固定效應)(原假設:使用OLS混合模型) xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe 對于固定效應模型而言,回歸結果中最后一行匯報的F統(tǒng)計量便在于檢驗所有的個體效應整體上顯著。在我們這個例子中發(fā)現(xiàn)F統(tǒng)計量的概率為0.0000,檢驗結果表明固定效應模型優(yōu)于混合OLS模型。 2、檢驗時間效應(混合效應還是隨機效應)(檢驗方法:LM統(tǒng)計量) (原假設:使用OLS混合模型) qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re (加上“qui”之后第一幅圖將不會呈現(xiàn)) xttest0 可以看出,LM檢驗得到的P值為0.0000,表明隨機效應非常顯著??梢?,隨機效應模型也優(yōu)于混合OLS模型。 3、檢驗固定效應模型or隨機效應模型 (檢驗方法:Hausman檢驗) 原假設:使用隨機效應模型(個體效應與解釋變量無關) 通過上面分析,可以發(fā)現(xiàn)當模型加入了個體效應的時候,將顯著優(yōu)于截距項為常數(shù)假設條件下的混合OLS模型。但是無法明確區(qū)分FE or RE的優(yōu)劣,這需要進行接下來的檢驗,如下: Step1:估計固定效應模型,存儲估計結果 Step2:估計隨機效應模型,存儲估計結果 Step3:進行Hausman檢驗 xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re est store re xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe est store fe hausman fe re (或者更優(yōu)的是hausman fe,sigmamore/ sigmaless) 可以看出,hausman檢驗的P值為0.0000,拒絕了原假設,認為隨機效應模型的基本假設得不到滿足。此時,需要采用工具變量法或者使用固定效應模型。 (三)靜態(tài)面板數(shù)據(jù)模型估計 1、固定效應模型估計 其中選項fe表明我們采用的是固定效應模型,表頭部分的前兩行呈現(xiàn)了模型的估計方法、界面變量的名稱(id)、以及估計中使用的樣本數(shù)目和個體的數(shù)目。第3行到第5行列示了模型的擬合優(yōu)度、分為組內(nèi)、組間和樣本總體三個層面,通常情況下,關注的是組內(nèi)(within),第6行和第7行分別列示了針對模型中所有非常數(shù)變量執(zhí)行聯(lián)合檢驗得到的F統(tǒng)計量和相應的P值,可以看出,參數(shù)整體上相當顯著。需要注意的是,表中最后一行列示了檢驗固定效應是否顯著的F統(tǒng)計量和相應的P值。顯然,本例中固定效應非常顯著。 2、隨機效應估計省略 3、時間固定效應(以上分析主要針對的是個體效應) 如果希望進一步在上述模型中加入時間效應,可以采用時間虛擬變量來實現(xiàn)。首先,我們需要定義一下T-1個時間虛擬變量。 tab year ,gen(dumt) (tab命令用于列示變量year的組類別,選項gen(dumt)用于生產(chǎn)一個以dumt開頭的年度虛擬變量) drop dumt1 (作用在于去掉第一個虛擬變量以避免完全共線性) 若在固定效應模型中加入時間虛擬變量,則估計模型的命令為: xtreg lngdp lnfdi lnie lnex lnim lnci lngp dumt*,fe (四)異方差和自相關檢驗 1、異方差檢驗 (組間異方差)本節(jié)主要針對的是固定效應模型進行處理 1)檢驗 原假設:同方差,需要檢驗模型中是否存在組間異方差,需要使用xttest3命令。 qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp ,fe xttest3 顯然,原假設被拒絕。此時,需要進一步以獲得參數(shù)的GLS估計量,命令為xtgls: xtgls lngdp lnfdi lnie lnex lnim lnci lngp,panels(heteroskedastic) 其中,組間異方差通過panels()選項來設定。上述結果是采用兩步獲得,即,先采用OLS估計不考慮異方差的模型,進而利用其殘差計算。并最終得到FGLS估計量。 2、序列相關檢驗 對于T較大的面板而言,往往無法完全反映時序相關性,此時便可能存在序列相關,在多數(shù)情況下被設定為AR(1)過程。 原假設:序列不存在相關性。 (1) FE模型的序列相關檢驗 對于固定效應模型,可以采用Wooldridge檢驗法,命令為xtserial: xtserial lngdp lnfdi lnie lnex lnim lnci lngp (2) RE模型的序列相關檢驗 對于RE模型,可以采用xttest1命令來執(zhí)行檢驗: qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp dumt*,re xttest1 這里匯報了4個統(tǒng)計量,分別用于檢驗RE模型中隨機效應(單尾和雙尾)、序列相關以及二者的聯(lián)合顯著性,檢驗結果表明存在隨機效應和序列相關,而且對隨機效應和序列相關的聯(lián)合檢驗也非常顯著。 (3) 穩(wěn)健型估計 上述結果表明,無論是FE還是RE模型,干擾項中都存在顯著的序列相關。為此,我們進一步采用xtregar命令來估計模型,首先考慮固定效應模型: xtregar lngdp lnfdi lnie lnex lnim lnci lngp dumt*,fe lbi 3、“異方差—序列相關”穩(wěn)健型標準誤 雖然上述估計方法在估計方差-協(xié)方差矩陣時考慮了異方差和序列相關的影響,但都未將兩者聯(lián)立在一起考慮,要獲得“異方差-序列相關”穩(wěn)健型標準誤,只需在xtreg命令中附加vce(robust)或者vce(cluster)選項即可。例如,對于FE模型,我們可以執(zhí)行如下命令: xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe vce(robust) 與之前未經(jīng)處理的估計結果相比,附加命令vce(robust)選項時的結果,雖然系數(shù)的估計值未發(fā)生變化,但此時得到的標準誤明顯增大了,致使得到的估計結果更加保守。對于面板數(shù)據(jù)模型而言,STATA在計算所謂的“robust”標準誤時,是以個體為單位調(diào)整標準誤的。因此,我們得到的“robust”標準誤其實是同時調(diào)整了異方差和序列相關后的標準誤。換言之,上述結果與設定vce(cluster)選項的結果完全相同。 4、截面相關檢驗 原假設:截面之間不存在著相關性 (1)FE模型檢驗 對于FE模型,可以利用xttest2命令來檢驗截面相關性: qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe xttest2 (該命令主要針對的是大T小N類型的面板數(shù)據(jù),在本例中無法使用,故圖標略去。) (2)RE模型檢驗 對于RE模型,可以利用xtcsd命令來檢驗截面相關性: qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re xtcsd,pesaran (下面命令是另一個檢驗指標) xtcsd,frees 可以看出,兩種不同的檢驗方法均顯示面板數(shù)據(jù)存在著截面相關性。 5、“異方差—序列相關—截面相關”穩(wěn)健型標準誤 1)FE模型估計 對于FE模型,在確認上述存在著截面相關的情況下,我們可以采用Hoechle(2007)編寫的xtscc命令獲取Driscoll and Kraay(1998)提出的“異方差—序列相關—截面相關”穩(wěn)健型標準誤: xtscc lngdp lnfdi lnie lnex lnim lnci lngp,fe 這里,xtscc命令會自動選擇的滯后階數(shù)為2,系數(shù)估計值和Within-R2與xtreg,fe的結果完全相同,但標準誤存在著較大差異。可見,在本例中,截面相關對統(tǒng)計推斷有較大的影響。 若讀者有跟高的方法來確定自相關的滯后階數(shù),則可以通過lag( )選項設定。當然,在多數(shù)情況下,這很難做到。不過我們可以通過附加lag(0)來估計僅考慮異方差和截面相關的穩(wěn)健型標準誤,命令如下: xtscc lngdp lnfdi lnie lnex lnim lnci lngp,fe lag(0) (2) RE模型估計(略,待補充) 二.動態(tài)面板數(shù)據(jù)的STATA處理命令 (一)差分GMM xtabond Setup webuse abdata Basic model with two lags of dependent variable included as regressors xtabond n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) xtabond n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) vce(robust) xtabond n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) twostep Treat w and k as predetermined and include w, L.w, k, L.k, and L2.k as additional regressors xtabond n l(0/2).ys yr1980-yr1984, lags(2) pre(w, lag(1,.)) pre(k, lag(2,.)) Treat L.w and L2.k as endogenous and include w, L.w, k, L.k, and L2.k as additional regressors xtabond n l(0/2).ys yr1980-yr1984, lags(2) endogenous(w, lag(1,.)) endogenous(k, lag(2,.)) (二)系統(tǒng)GMM Setup webuse abdata Basic model with strictly exogenous covariates and two lags of the dependent variable xtdpdsys n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) Same model with a robust VCE xtdpdsys n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) vce(robust) Two-step estimator of the same model xtdpdsys n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) twostep vce(robust) Now allow some of the covariates to be predetermined xtdpdsys n l(0/1).w l(0/2).(k ys) yr1980-yr1984, lags(2) twostep pre(w, lag(1,.)) pre(k,lag(2,.)) Now allow some of the covariates to be endogenous xtdpdsys n l(0/1).ys yr1980-yr1984, lags(2) twostep endogenous(w, lag(1,.)) endogenous(k,lag(2,.)) (三)內(nèi)生性檢驗 estat sargan 三.logit與probit模型 對于面板數(shù)據(jù),如果被解釋變量為離散變量或者虛擬變量時,使用離散選擇模型,也就是面板二值選擇模型。以二值選擇(被解釋變量取值為0或1)為例,當被解釋變量取1的概率為標準正態(tài)分布時,使用probit模型;當被解釋變量取1的概率為logistic分布時,使用logit模型。 面板二值選擇模型固定效應 xtprobit y x1 x2 x3,fe xtlogit y x1 x2 x3,fe 面板二值選擇模型隨機效應 Random-effects (RE) model xtprobit depvar [indepvars] [if] [in] [weight] [, re RE_options] Random-effects (RE) model xtlogit depvar [indepvars] [if] [in] [weight] [, re RE_options] 案例講解: Setup webuse union Random-effects logit model xtlogit union age grade i.not_smsa south##c.year Fixed-effects logit model xtlogit union age grade i.not_smsa south##c.year, fe Hausman檢驗 hausman fe re 四.面板泊松模型 面板泊松模型命令為xtpoisson,語法格式為: Random-effects (RE) model xtpoisson depvar [indepvars] [if] [in] [weight] [, re RE_options] Random-effects model xtpoisson accident op_75_79 co_65_69 co_70_74 co_75_79, exposure(service) irr Fixed-effects model xtpoisson accident op_75_79 co_65_69 co_70_74 co_75_79, exposure(service) irr fe 五.面板負二項模型 面板負二項模型模型命令為xtnbreg,語法格式為: Syntax Random-effects (RE) and conditional fixed-effects (FE) overdispersion models xtnbreg depvar [indepvars] [if] [in] [weight] [, [re|fe] RE/FE_options] Population-averaged (PA) model xtnbreg depvar [indepvars] [if] [in] [weight], pa [PA_options] 案例介紹為: Setup webuse airacc Random-effects model xtnbreg i_cnt inprog, exposure(pmiles) irr 其中,默認的為re隨機效應,而irr表示匯報發(fā)生率比 Fixed-effects model xtnbreg i_cnt inprog, exposure(pmiles) irr fe 六.面板Tobit模型 面板Tobit模型模型命令為xttobit,語法格式為: xttobit depvar [indepvars] [if] [in] [weight] [, options] 其中depvar :被解釋變量。indepvars :解釋變量。noconstant :不含截距項。ll[(varname|#)] :左刪失變量。ul[(varname|#)] :右刪失變量。vce(vcetype) :參數(shù)估計量方差協(xié)方差矩陣一致估計 格式為: xttobit y x1 x2 x3, ll(#) ul(#) tobit 其中l(wèi)l(#)表示下限, ul(#) 表示上限, tobit表示對原假設進行LR檢驗。 webuse nlswork3 xtset idcode xttobit ln_wage union age grade not_smsa south##c.year, ul(1.9) 七.面板工具變量法 面板工具變量法命令為xtivreg webuse nlswork 固定效應估計 xtivreg ln_w age c.age#c.age not_smsa (tenure = union south), fe 隨機效應GLS模型 xtivreg ln_w age c.age#c.age not_smsa 2.race (tenure = union birth south), re 八.面板隨機前沿模型 面板隨機前沿模型命令為xtfrontier,語法格式為: xtfrontier depvar [indepvars] [if] [in] [weight] , ti [ti_options] 選項 depvar表示被解釋變量, indepvars表示解釋變量,noconstant 不含截距項。ti :表示估計技術效率不隨時點變化的隨機效應模型,vce(vcetype) :參數(shù)估計量方差協(xié)方差矩陣一致估計,tvd表示估計隨機效應的時變衰減模型。 下面以系統(tǒng)自帶的 xtfrontier1數(shù)據(jù)為例進行隨機效應模型的分析,該數(shù)據(jù)變量為machines表示資本,workers 表示勞動力,lnwidgets表示產(chǎn)量對數(shù),lnmachines、lnworkers分別表示資產(chǎn)和勞動力取完對數(shù)。 Time-invariant model xtfrontier lnwidgets lnmachines lnworkers, ti Time-varying decay model xtfrontier lnwidgets lnmachines lnworkers, tvd Time-varying decay model with a constraint constraint 1 [eta]_cons = 0 xtfrontier lnwidgets lnmachines lnworkers, tvd constraints(1) |
|