爬蟲俱樂部攜友萬科技舉辦的“爬蟲俱樂部第五屆Stata編程技術訓練營”2017年北京專場于4月16日在北京理工大學大數據創新中心圓滿落幕。北京的熱情似火并沒有影響大家學習的熱情,為期三天的培訓讓大家收獲滿滿?,F場有來自北京大學、中國人民大學、天津大學、北京理工大學、中央財經大學、中南財經政法大學、吉林大學、武漢大學、對外經濟貿易大學、河北經貿大學、重慶大學、湖南第一師范學院、山東財經大學、中國石油大學、河南大學、北京師范大學、華中師范大學、中山大學、江西財經大學等四十多名教師和學者一起參與了本次會議。
本次會議內容秉承由簡入深、刪繁就簡的原則,課程主要的內容覆蓋了多種復雜數據的讀取、各種數據整理的技巧、源代碼腳本的快速處理、簡單網絡爬蟲工具、利用正則表達式的文本處理技術和利用正則表達式的網絡爬蟲技術等實用技術。通過具體的案例對每部分技術進行講解,使大家能夠快速的掌握Stata的基本命令、編程、數據處理以及抓取網絡數據的方法。通過本次培訓,讓大家對STATA軟件編程技術有了更深入的認識,并在其工作崗位上發揮其強大的功能。
前兩天由李春濤教授講解Stata基礎與DOS命令介紹、數據的讀入、局部宏與全局宏的定義、宏擴展函數應用、系統常量的訪問、循環格式、copy命令、post命令、以及回歸與結果輸出等。
并通過用Stata整理CSSCI期刊目錄、股價同步性與事件研究等案例來展示這些技術的運用方法。
他還通過對上市公司公告的抓取、NBER工作論文的下載等案例講解了Stata網絡爬蟲技術的整體思路,以及對網絡信息與數據的抓取和抓取之后處理信息與數據的方法。
第三天,由薛原老師介紹了Stata中與正則表達式相關的字符串函數、元字符與匹配模式,并通過幾個案例介紹了正則表達式在詞頻統計、網絡爬蟲中的運用。
在會議期間,會務組一如既往地安排了參會嘉賓現場操作與交流答疑環節,并提供了豐富的午餐及交流晚宴,讓大家在學習的同時為所有喜愛STATA軟件的專業人士搭建起溝通的橋梁。
在熱烈的掌聲中,培訓課程圓滿結束。感謝爬蟲團隊提供豐富的培訓內容;感謝李春濤教授和薛原老題的精彩講解;感謝參會學員對我們工作的支持和理解;感謝北京理工大學大數據創新學習中心、雪晴數據網對本次會議的大力支持。
為了保證培訓課程質量,我們一直控制會議的規模,參會人數有限,導致有些老師和學者沒有參加此次培訓,請大家繼續關注友萬科技;繼續關注爬蟲俱樂部(微信公眾號)。今后我們將攜手定期舉辦Stata軟件在編程及數據統計分析方面技能等培訓、以及分行業的專題研討會。
Uone-Tech "智慧教育、創新科研" 2017,我們在路上……