接上文:【Stata專欄】異方差穩健標準誤:一些實際考慮(一)
離散協變量
對于β3和β5以及N=100,以下情況成立。HC1zui接近5%的排斥率。當異方差不高時,HC2接近5%的排斥率。當異方差高時,HC2的排斥率低于5%。HC3和WB具有小于0.05的5%排斥率。異方差越大,速率越小。HC3和野生助推器的比率始終低于HC2。
對于β4和β6以及N=100,以下情況成立。HC1和HC2具有5%的排斥率,對于低水平的異方差。在這些情況下,HC3接近理想速率。當異方差高時,HC1的行為保持不變,HC2接近理想速率,HC3開始產生低于0.05的速率。世行的匯率將始終低于所有其他估算值。
當N=1000時,當異方差小于很高時,所有估計都接近理想的拒絕率。當異方差非常高時,HC1更接近于zui佳抑制率。當N=5000時,除HC3外,所有估計值都接近理想的拒絕率,HC3的拒絕率在非常高的異方差水平下低于0.05。
下表4給出了當樣本大小為N=100時,不同異方差水平的4個VCE估計器的模擬結果。表5和6顯示了N=1000和N=5000的結果。
表4:離散協變量:不同異方差水平的5%拒絕率
N=100和2000次復制的模擬結果 | |||||
參數 | VCE | γ=0.5 | γ=1.0 | γ=1.5 | γ=2.0 |
β3 | HC1 | 0.054 | 0.052 | 0.051 | 0.047 |
HC2 | 0.053 | 0.050 | 0.044 | 0.034 | |
HC3 | 0.046 | 0.038 | 0.026 | 0.022 | |
WB | 0.032 | 0.032 | 0.030 | 0.027 | |
β4 | HC1 | 0.084 | 0.082 | 0.076 | 0.068 |
HC2 | 0.072 | 0.071 | 0.063 | 0.049 | |
HC3 | 0.058 | 0.053 | 0.042 | 0.025 | |
WB | 0.040 | 0.039 | 0.031 | 0.025 | |
β5 | HC1 | 0.049 | 0.050 | 0.046 | 0.048 |
HC2 | 0.047 | 0.045 | 0.037 | 0.035 | |
HC3 | 0.036 | 0.035 | 0.028 | 0.019 | |
WB | 0.033 | 0.033 | 0.027 | 0.028 | |
β6 | HC1 | 0.081 | 0.078 | 0.068 | 0.061 |
HC2 | 0.069 | 0.066 | 0.059 | 0.045 | |
HC3 | 0.050 | 0.047 | 0.037 | 0.027 | |
WB | 0.037 | 0.033 | 0.024 | 0.020 |
表5:離散協變量:不同異方差水平的5%拒絕率
N=1000和2000次復制的模擬結果 | |||||
參數 | VCE | γ=0.5 | γ=1.0 | γ=1.5 | γ=2.0 |
β3 | HC1 | 0.047 | 0.053 | 0.053 | 0.040 |
HC2 | 0.047 | 0.051 | 0.049 | 0.032 | |
HC3 | 0.045 | 0.050 | 0.044 | 0.027 | |
WB | 0.043 | 0.052 | 0.049 | 0.037 | |
β4 | HC1 | 0.051 | 0.054 | 0.056 | 0.040 |
HC2 | 0.051 | 0.051 | 0.049 | 0.032 | |
HC3 | 0.049 | 0.046 | 0.045 | 0.029 | |
WB | 0.050 | 0.047 | 0.050 | 0.036 | |
β5 | HC1 | 0.044 | 0.054 | 0.051 | 0.054 |
HC2 | 0.044 | 0.053 | 0.048 | 0.046 | |
HC3 | 0.042 | 0.050 | 0.045 | 0.039 | |
WB | 0.043 | 0.053 | 0.049 | 0.048 | |
β6 | HC1 | 0.053 | 0.057 | 0.051 | 0.049 |
HC2 | 0.052 | 0.054 | 0.048 | 0.043 | |
HC3 | 0.050 | 0.052 | 0.042 | 0.038 | |
WB | 0.047 | 0.052 | 0.046 | 0.041 |
表6:離散協變量:不同異方差水平的5%拒絕率
N=5000和2000次復制的模擬結果 | |||||
參數 | VCE | γ=0.5 | γ=1.0 | γ=1.5 | γ=2.0 |
β3 | HC1 | 0.046 | 0.053 | 0.049 | 0.045 |
HC2 | 0.046 | 0.053 | 0.047 | 0.043 | |
HC3 | 0.046 | 0.052 | 0.045 | 0.040 | |
WB | 0.045 | 0.052 | 0.049 | 0.045 | |
β4 | HC1 | 0.058 | 0.054 | 0.048 | 0.048 |
HC2 | 0.058 | 0.054 | 0.047 | 0.044 | |
HC3 | 0.057 | 0.053 | 0.045 | 0.039 | |
WB | 0.058 | 0.052 | 0.047 | 0.049 | |
β5 | HC1 | 0.050 | 0.058 | 0.047 | 0.045 |
HC2 | 0.050 | 0.057 | 0.044 | 0.041 | |
HC3 | 0.049 | 0.057 | 0.042 | 0.038 | |
WB | 0.048 | 0.055 | 0.046 | 0.043 | |
β6 | HC1 | 0.055 | 0.059 | 0.051 | 0.045 |
HC2 | 0.055 | 0.058 | 0.050 | 0.041 | |
HC3 | 0.055 | 0.056 | 0.049 | 0.039 | |
WB | 0.055 | 0.059 | 0.051 | 0.046 |
Long和Erwin型模擬
作者再次對三個樣本大小進行模擬。與Long和Erwin(2000)一樣,我允許協變量之間的相關性,并包括連續和分類協變量。誤差項是不正常的,允許整個過程中有高水平的異方差。與Long和Erwin(2000)的五個參數不同,關注的是六個參數。
當樣本大小為N=100時,zui大杠桿的平均值約為0.24,對于某些平局,可能達到0.46。這與MacKinnon和White型模擬相比不那么嚴重,但對于HCk估算器,仍會產生高于0.05的拒絕率。當樣本大小為N=1000時,平均zui大杠桿約為0.042,zui大杠桿約0.11。當N=5000時,zui大杠桿始終低于0.04。
作者對Long和Erwin類型的模擬得出了類似的結論,在上一節中對MacKinnon和White類型的模擬也得出了類似結論。當逼近連續協變量β1和β2的理想拒絕率時,HC3zui好,但對于離散協變量,HC3的拒絕率較低。對于離散協變量,HC1zui接近理想拒絕率,但對于連續協變量具有高拒絕率。對于連續協變量,HC2優于HC1,但對于離散協變量,則更差。世行的覆蓋率往往低于0.05,低于其他估算值。
在下表7中,我們給出了所有協變量和樣本大小的拒絕率。
表7:兩種樣本尺寸的5%拒絕率
參數 | VCE | N=100 | N=1000 | N=5000 |
β1 | HC1 | 0.099 | 0.054 | 0.053 |
HC2 | 0.082 | 0.051 | 0.052 | |
HC3 | 0.064 | 0.050 | 0.052 | |
WB | 0.035 | 0.047 | 0.055 | |
β2 | HC1 | 0.089 | 0.052 | 0.042 |
HC2 | 0.073 | 0.050 | 0.042 | |
HC3 | 0.056 | 0.048 | 0.042 | |
WB | 0.043 | 0.051 | 0.044 | |
β3 | HC1 | 0.046 | 0.046 | 0.050 |
HC2 | 0.045 | 0.044 | 0.049 | |
HC3 | 0.033 | 0.044 | 0.049 | |
WB | 0.026 | 0.047 | 0.052 | |
β4 | HC1 | 0.031 | 0.044 | 0.050 |
HC2 | 0.024 | 0.044 | 0.050 | |
HC3 | 0.014 | 0.040 | 0.049 | |
WB | 0.011 | 0.046 | 0.051 | |
β5 | HC1 | 0.047 | 0.063 | 0.057 |
HC2 | 0.038 | 0.061 | 0.057 | |
HC3 | 0.025 | 0.060 | 0.057 | |
WB | 0.013 | 0.063 | 0.061 | |
β6 | HC1 | 0.059 | 0.060 | 0.061 |
HC2 | 0.045 | 0.059 | 0.060 | |
HC3 | 0.030 | 0.057 | 0.060 | |
WB | 0.023 | 0.062 | 0.060 |
Angrist和Pischke型模擬
作者模擬了Angrist和Pischke(2009)模擬,但不允許30個樣本大小,而是允許3個不同的樣本大小,N=100、N=300和N=1000。所有結果見下表8。這里作者試圖恢復一個二元回歸的參數。當有100次觀察時,除了WB低于0.05外,所有估計的覆蓋率都高于0.05。zui大杠桿的平均值約為0.11,zui大值為0.5。當樣本量為N=300和N=1000時,所有估計值都接近0.05的拒絕率。以下是模擬結果。
表8:三種樣本尺寸的5%拒絕率
參數 | VCE | N=100 | N=300 | N=1000 |
β1 | HC1 | 0.099 | 0.055 | 0.055 |
HC2 | 0.082 | 0.052 | 0.054 | |
HC3 | 0.066 | 0.048 | 0.053 | |
WB | 0.030 | 0.040 | 0.050 |
結論
從文獻和作者的模擬中,作者得出結論,當使用異方差一致標準誤差時,zui重要的考慮是對您想要估計的每個參數(回歸)進行許多觀察。此外,每當您擔心標準錯誤的有效性時,您應該查看擬合模型所隱含的杠桿點。杠桿率接近1應該是令人擔憂的原因。仿真表明,非常高的杠桿點產生的VCE估計值不接近理想的拒絕率。
參考文獻:
Angrist, J. D., and J.-S. Pischke. 2009. Mostly Harmless Econometrics: An Empiricist’s Companion. Princeton, NJ: Princeton University Press.
Cattaneo, M. D., M. Jansson, and W. K. Newey. 2018. Inference in linear regression models with many covariates and heteroscedasticity.
Journal of the American Statistical Association113: 1350–1361. https://doi.org/10.1080/01621459.2017.1328360.
Chesher, A., and I. Jewitt. 1987. The bias of a heteroskedasticity consistent covariance matrix estimator.
Econometrica55: 1217–1222. https://doi.org/10.2307/1911269.
Chesher, A., and G. Austin. 1991. The finite-sample distributions of heteroskedasticity robust Wald statistics.
Journal of Econometrics47: 153–173. https://doi.org/10.1016/0304-4076(91)90082-O.
Long, J. S., and L. H. Ervin. 2000. Using heteroscedasticity consistent standard errors in the linear regression model.
American Statistician54: 217–224. https://doi.org/10.2307/2685594.
MacKinnon, J. G. 2012. Thirty years of heteroscedasticity-robust inference. In
Recent Advances and Future Directions in Causality, Prediction, and Specification Analysis, ed. X. Chen, and N. R. Swanson, 437–461. New York: Springer. https://doi.org/10.1007/978-1-4614-1653-1_17.
MacKinnon, J., and H. White. 1985. Some heteroskedasticity-consistent covariance matrix estimators with improved finite sample properties.
Journal of Econometrics29: 305–325. https://doi.org/10.1016/0304-4076(85)90158-7.
White, H. 1980. A heteroskedasticity-consistent covariance matrix estimator and a direct test for heteroskedasticity.
Econometrica48: 817–838. https://doi.org/10.2307/1912934
附錄:文件和模擬(閱讀原文獲得數據鏈接)
對于MacKinnon型模擬,每個樣本大小和異方差級別都有一個文件。有許多方法可以使用下列這些文件運行模擬。Stata提供了每一個,以便那些想要使用它們的人能夠決定哪種方式是zui好的。
例如,對于樣本大小N=100,文件被命名為
gamma_05_100.do
gamma_1_100.do
gamma_15_100.do
gamma_20_100.do
第一個下劃線后面的數字表示異方差的級別。第二個下劃線后面的數字表示樣本大小。
對于Long和Erwin型模擬。有:
long_100.do
long_1000.do
long_5000.do
第一個下劃線后面的數字表示樣本大小。
對于Angrist和Pischke類型的模擬,命名約定與Long和Erwin情況相同。
harmless_100.do
harmless_300.do
harmless_1000.do
Stata軟件訂購
如需訂購Stata V17最新版軟件,請聯系Stata中國授權經銷商及合作伙伴北京友萬信息科技有限公司(www.uone-tech.cn)。我司擁有強大的售后服務團隊,聚合國內一線Stata行業專家為客戶提供優質的技術支持服務,并幫助中國用戶建立完善的軟件服務體系。手機/微信:18610597626 郵箱:crystal@uone-tech.cn。
立即獲取報價
熱門鏈接
專注分享商業數據分析、金融數據分析、應用統計分析、知識圖譜、機器學習、計量經濟、人工智能、網絡爬蟲、自動化報告與可重復研究等熱門技術內容。定向培養Stata、Python、Minitab、R語言數據人才,助力產學研政企商協同發展,為中國大數據產業蓄能。合作熱線:010-56548231 郵箱:info@uone-tech.cn