2017年2月17日,由爬蟲俱樂部(微信號)攜友萬科技舉辦的爬蟲俱樂部第四屆Stata編程技術訓練營-2017年武漢專場,于中南財經政法大學如期舉行。本次培訓邀請到中南財經政法大學金融學院李春濤教授、武漢大學羅知教授及爬蟲俱樂部薛原為主講人?,F場有來自北京大學、中山大學、武漢大學、復旦大學、社科院、暨南大學、華東師大、湖南大學、中國礦大、中國地大、南審、合肥工大、武漢理工大學、對外經貿大學、貴州財經、西南財經、中南財經、江西財經等高校的教師和學生大約50位學員參加了此次為期三天的Stata技術培訓。培訓內容涵蓋了復雜數據的讀取、數據整理的法寶、處理文本的利器、以及各種網絡爬蟲工具等實用技術。
第一天,數據的讀入與循環
(1) Stata基礎與DOS命令介紹
(2) Stata格式數據的讀入
(3)文本文件的讀入
(4)讀入Excel數據(single sheet vs multiple sheets)
(5)讀入固定寬度數據(文本文檔及網頁數據讀入)
(6)局部宏與全局宏的定義
(7)系統常量的訪問
(8)循環格式
(9)if, continue &break
(10)return code
(11)copy命令
(12)NBER工作論文的下載
(13)上市公司年報下載
(14)宏擴展函數應用(如何獲得文件名列表)
第二天,post命令、字符串函數與正則表達式、網絡數據抓取
(1)post命令簡介
(2)事件研究法(基于網絡數據)
(3)股價同步性計算(基于網絡數據)
(4)股本變更數據之整理
(5)字符串函數
(6)正則表達式初步
(7)名和姓的提取(UCLA例子)
(8)地址中郵政編碼的提取(UCLA例子)
(9)期刊名稱的提取
(10)百度新聞搜索結果數量的提取
(11)中文地址中城市的提取
(12)提取日期
(13)moss命令
(14)subinfile命令
(15)網絡數據抓取初步
第三天,回歸結果輸出、DID及RDD
(1)基本統計特征及其結果輸出
(2)分組比較之ttable2
(3)相關系數矩陣及其輸出
(4)各種回歸命令介紹
(5)回歸結果輸出之esttab
(6)雙重差分DID
(7)斷點回歸設計RDD
(8)分析師與盈余管理研究案例
本次培訓的內容秉承由簡入深、刪繁就簡的原則,課程主要包括網絡數據整理方法、正則表達式、結果輸出方法、雙重差分技術和斷點回歸技術。培訓課程經過李教授團隊多年的精心開發,通過選擇合理的內容,合適的順序,引用大量的例子,旨在幫助大家在較短的時間內掌握Stata軟件與金融計算的核心技術和方法。在內容講解期間,研討會一如既往地安排了參會嘉賓現場操作與交流答疑環節及茶歇飲品,爬蟲俱樂部及友萬科技服務團隊以最好的服務幫助大家對講解的內容進行理解。
請繼續關注友萬科技;繼續關注爬蟲俱樂部。今后我們將攜手定期舉辦Stata軟件在編程及數據統計分析方面技能等培訓、以及分行業的專題研討會。