2023年4月25日,StataCorp LLC 正式宣布 Stata 18 上線啦!
或許各位老師、Stata 愛好者們還沒把 Stata 17 捂熱,StataCorp LLC 就高效地推出了Stata 18。工欲善其事,必先利其器。StataCorp LLC 正如“有匪君子,如切如磋,如琢如磨”,將 Stata 這一利器打造得日益精良與強大。Stata中國授權經銷商及合作伙伴友萬科技聯合山東大學陳強教授團隊,第一時間為大家總結了此次發布的十大功能亮點,幫助大家快速了解Stata 18 強大的新功能!
Stata之所以能成為當下流行的計量經濟學軟件,根本原因在于Stata十分貼近計量經濟學的實踐應用。此次Stata 18的全新升級,一如既往地切中了時下實證研究的熱點與痛點??偨Y起來,主要有以下十大方面,下面將分別介紹:
1. 異質性DID
2. 中介效應
3. 多向聚類標準誤
4. 野聚類自助法
5. 工具變量分位數回歸
6. 貝葉斯模型平均
7. 描述性統計制表
8. 數據編輯器的改進
9. Do文件編輯器的改進
10. 全新的畫圖風格
異質性DID
雙重差分法(DID)是最常用的計量方法,近年來發展迅速,尤其在“交疊DID”(staggered DID)的領域。對于多期DID模型,若個體受到處理的初始時間不盡相同,且處理狀態不可逆(irreversible treatment),則稱為“交疊DID”(staggered DID)。傳統的雙向效應估計量(TWFE)及事件分析法(event study)均依賴于處理效應的同質性假設。然而,對于交疊DID,若處理效應存在異質性(即處理效應隨個體或時間而變),則無論TWFE或事件分析法均存在偏差。為此,Stata 18推出了在異質性處理效應的情況下也成立的異質性DID新命令hdidregress與xthdidregress,其中前者適用于重復截面數據,而后者適用于面板數據。
中介效應
中介效應分析是常見的機制分析方法,用于考察因果效應通過何種渠道而產生。例如,若研究發現“鍛煉”(exercise)可提升“身心健康”(well-being),我們想進一步知道,此效應是否(部分地)通過改變“荷爾蒙水平”(hormone level)這一中介(mediator)而起作用,參見下圖。
為此,Stata 18推出了新命令mediate,可自動進行中介效應分析,并將總效應(total effect)分解為直接效應(direct effects)與間接效應(indirect effects)。
多向聚類標準誤
統計推斷是實證分析的核心之一,而正確的標準誤則是統計推斷的核心。針對線性回歸模型(例如使用regress, areg或xtreg,fe估計的模型),Stata 18提供了適用于更多場景的穩健標準誤。例如,面板模型傳統上使用以個體為聚類變量的聚類穩健標準誤。然而,面板數據的聚類可能發生在多個維度,包括個體維度(同一個體不同期的擾動項存在自相關)與時間維度(同一時期不同個體的擾動項存在自相關)。Stata 18提供了估計“多向聚類標準誤”(multi-way cluster standard errors)的方便選項。例如,使用選擇項“vce(cluster clustvar1 clustvar2)”即可估計“雙向聚類標準誤”(two-way cluster standard errors),而選擇項“vce(cluster clustvar1 clustvar2 clustvar3)”則可提供在三個維度聚類的聚類標準誤,以此類推。
野聚類自助法
在使用聚類穩健標準時,通常要求聚類數目較大,才能保證所估標準誤為真實標準誤的較好近似。然而,現實數據的聚類數目可能較小,而每個聚類內部的觀測值也不均衡。此時,使用漸近理論計算的聚類標準誤可能存在較大偏差,而“野聚類自助法”(wild cluster bootstrap)則可提供計算標準誤的更優方法。所謂“野自助法”就是一種“殘差自助法”(residual bootstrap),即對殘差進行自助抽樣;而“聚類自助法”則意味著以聚類為單位進行自助抽樣。為此,Stata 18推出了新命令wildbootstrap,可方便地估計線性模型的野聚類標準誤,例如
. wildbootstrap regress y x1 x2
. wildbootstrap areg y x1 x2, absorb(x3)
. xtset id
. wildbootstrap regress y x1 x2
工具變量分位數回歸
常見的均值回歸僅考察解釋變量如何影響被解釋變量的均值;而分位數回歸則可度量對被解釋變量各分位數的影響,從而全面刻畫對被解釋變量條件分布的作用。但原有的Stata分位數回歸命令qreg假定所有解釋變量均為外生。然而,內生變量在實證研究中很常見。為此,Stata 18推出了新命令ivqregress,可對分位數回歸模型進行工具變量法的估計,并進行內生性檢驗(endogeneity test),以及提供在弱工具變量下也成立的穩健置信區間(confidence intervals that are robust to weak instruments)。
貝葉斯模型平均
實證研究的一個基本問題是模型選擇(model selection)。傳統做法是通過信息準則等方法,選擇最優模型。但我們依然可能選錯模型,從而導致偏差。面對模型的不確定性(model uncertainty),更穩健的做法可能是,同時估計多個模型,并通過貝葉斯原理評估每個模型的發生的概率。然后,以此概率為權重,對所有模型進行加權平均,即所謂“貝葉斯模型平均”(Bayesian model averaging,簡記BMA)。為此,Stata 18推出了新命令bmaregress,可對線性回歸模型自動進行BMA估計與預測。
描述性統計制表
實證論文的“Table 1”通常都是描述性統計(descriptive statistics)。Stata 18新推出了dtable命令,可方便地將連續變量與離散變量的統計特征制表。用戶可選擇匯報何種統計量,或根據離散變量的取值將數據分為若干子樣本,并比較相應的統計量。用戶還可定制表格的具體形式,并將其輸出到Word,Excel, HTML, Markdown, PDF, LaTex, SMCL或文本文件。
數據編輯器的改進
Stata 18 對數據編輯器作了諸多方便用戶的改進,這包括
●可固定的行與列 (pinnable rows and columns)。在使用數據編輯器翻看數據時,已固定的行或列(pinned rows or columns)并不會隨之滾動。這使得察看與比較數據更為方便;例如,可固定表示ID的變量。
●調整字符串的顯示格子 (resizable cell editor for string data)。在編輯字符串數據時,可通過調整顯示格子,以展示更多字符串,而不至于被隱藏。
●截斷文本的提示框 (tooltips for truncated text)。在顯示格子中,若文本因太長而被截斷,只要將鼠標放于格子上,即會彈出包含完整文本的提示框。
●支持比例寬度字體 (proportional-width font support)。這將有助于提高數據的可讀性,并允許同時展示更多變量,而無須滾動。
●在列標題顯示變量標簽 (show variable labels in column header)。變量標簽將直接在變量名之下展示,這將有助于察看變量名不夠直觀的數據。
●通過新的鍵盤快捷鍵隱藏或顯示變量的取值標簽 (new keyboard shortcut for hiding or showing value labels)。這將便于用戶在顯示數值(numeric values)與標簽(labels)之間快捷地切換。
Do文件編輯器的改進
Stata 18對于Do文件編輯器做了進一步的改進,包括
●自動備份 (automatic backup)。以Do文件編輯器打開的所有文件都將周期性地自動存盤備份,以防止因意外關機而丟失程序。
●用戶指定關鍵詞的語法高亮 (syntax-highlight for user-defined keywords)。用戶可以自行指定對哪些關鍵詞進行語法高亮顯示,并選擇高亮的顏色與字體(粗體或斜體)。
全新的畫圖風格
Stata 18帶來了全新的畫圖風格。新的默認畫圖風格將包括許多用戶渴望的如下特征:
●白色背景 (white background)
●帶有亮色的更新調色板 (updated color palette with bright colors)
●y軸標簽的水平展示 (horizontal y-axis labels)
●更寬的寬高比 (wider aspect ratio)
●某些圖可實現圖例的動態放置 (dynamic legend placement for certain graphs)
●其它更多特征
例如,這是在新風格下的條形圖:
對比舊風格下的條形圖:
事實上,Stata 18 引入了四個新的畫圖風格,即 stcolor, stcolor_alt, stgcolor與stgcolor_alt。其中,stcolor 為默認風格,而其余風格為提供了對于圖片寬度與圖例放置的不同選擇。
?。ò鏅嗌昝鳎罕疚恼聻樵瓌?,轉載請說明出處)