2019 Stata夏季訓練營暨機器學習與Stata、R應用研討會于2019年8月17-19日在上海財經大學火熱開營并取得圓滿成功!近年來人工智能迅速進入大眾視野,并在全球范圍內迎來了行業的快速發育期。機器學習作為人工智能的組成部分,無疑是人工智能科學研究和應用領域的重要驅動力,將帶來一系列傳統決策機制的根本性變革,勢必推動社會科學研究范式的重大轉型。 機器學習最基本的做法,是使用算法來解析數據、從中學習,然后對真實世界中的事件做出決策和預測。與傳統的為解決特定任務、硬編碼的軟件程序不同,機器學習是用大量的數據來“訓練”,通過各種算法從數據中學習如何完成任務。在本課程中主要介紹機器學習的基本思想與算法,并結合具體案例,介紹Stata和R語言實踐操作。
“計量男神”陳強老師開辦過多次計量相關的現場班,反響都非常好,好評度也非常高,本次訓練營是陳老師首期講機器學習相關內容的現場班,參加課程的學者們充滿了期待。來自全國60所高校和科研單位的近百名學者齊聚上海財經大學,跟著陳強老師一起走進機器學習。參加本次培訓班的學者既有剛剛入學的碩士生,也有年逾六十的資深教授;既有普通院校的學子,也不乏北大復旦上財的精英,名校的海歸教師,甚至暑期在國內的海外學者與留學生。從涵蓋專業來看,除了經管社科外,也吸引了不少醫學衛生領域的專家。感謝學者們熱情參與,感謝上海財經大學承辦本次夏令營并為學者們提供了一個設備先進、配置齊全的教學環境,感謝校方的大力支持。
8月16日下午開始, 學者們陸續簽到、領取資料,會務組專門為學者們準備了“新版Stata 16 MP2軟件”試用現場安裝,確保每位老師都能正常、安全的運行數據資源,保證上課質量。
在三天的授課過程中,教室的空氣里似乎始終彌漫著一種令人激動的氛圍。陳強教授開宗明義地祝賀大家,作出了正確的決定,成為最早一批學習與應用機器學習的探索者。
課上座無虛席
陳老師隨后將機器學習的精髓知識,由淺入深,如數家珍,娓娓道來,絲絲入扣,環環相連,再結合Stata與R語言的經典案例,不時讓學員們豁然開朗,感受頓悟的喜悅。用陳老師自己的話來說,“三天可以得到兩個寶,即機器學習與R語言,這門課實在是太值了”。
在課間與課后,陳強老師還耐心地解答了學員們的所有問題,當場釋疑解惑。
課 程 大 綱
第一講 機器學習引論 | 什么是機器學習 、機器學習的分類與術語 、案例:垃圾郵件過濾;手寫體數字識別;圖像識別;自動駕駛 |
第二講 懲罰回歸 | OLS、 Ridge Regression 、 Lasso 、Elastic Net 、交叉驗證 (Cross-validation) 、 Post Double Lasso and IV Lasso 、 Stata案例 |
第三講 線性分類 | Logit 、多項Logit 、 貝葉斯決策理論 、 線性判別分析 、二次判別分析 、 ROC/AUC 、Stata案例 |
第四講 R語言快速入門 | Why R? 、 安裝R與RStudio 、R的對象(vector, matrix, data frame, list) 、 面向對象的函數式語言 、 R語言畫圖 |
第五講 樸素貝葉斯 | 樸素貝葉斯、 拉普拉斯修正、R案例 |
第六講 K近鄰法 | KNN for Regression 、 KNN for Classification 、偏差與方差的權衡 、 維度災難 、 R案例 |
第七講 決策樹 (Decision Tree) | 分類樹、 分裂準則(錯分率、基尼指數、信息熵)、 修枝與交叉驗證、 回歸樹、 R案例 |
第八講 裝袋法與隨機森林 | 集成學習(Ensemble Learning) 、裝袋法(Bagging) 、隨機森林(Random Forest) 、變量重要性(Variable Importance) 、偏依賴圖(Partial Dependence Plot) 、R案例 |
第九講 提升法 | 自適應提升法 (AdaBoost) 、 AdaBoost的統計解釋 、 梯度提升法 (Gradient Boosting Machine) 、 R案例 |
第十講 支持向量機 | Maximal Margin Classifier 、 Soft Margin 、 Support Vector Machine 、 Kernel Trick 、 R案例 |
第十一講 支持向量機 | 前饋神經網絡 、反向傳播算法(Back-propagation Algorithm) 、隨機梯度下降(Stochastic Gradient Descent) 、神經網絡的過擬合 、深度學習的發展 、R案例 |
第十二講 機器學習在經濟學的應用 | 精讀幾篇在經濟學頂刊發表的經典機器學習論文 |
過短短三天的學習與操作,學員們紛紛表示,收獲巨大,陳老師的課程揭開了機器學習的神秘面紗,原本覺得很難的機器學習經過陳老師的講解變得如此簡單(以下為學員反饋):
● 今天聽了您的課,收獲很多!
● 謝謝陳老師!聽您講課受益良多!
● 陳強老師的高維空間景色宜人……
● 感謝陳老師!每次聽課都收益匪淺!
● 謝謝陳老師,這幾天學了不少新的東西,辛苦了!
● 近幾日聽您講課收獲很大,今后還要向您多多學習!
● 很榮幸這次在上財能夠聆聽您的課。您的計量書籍對我的學習幫助很大,謝謝您!
● 今天上課干貨滿滿……這兩天參加您的培訓,收獲很大,希望未來有機會也請您到我們學校交流。
● 陳老師好,以前都是讀你的書,給學生推薦你的書和公眾號,這幾天聽你講課,信手拈來,深入淺出,果然是高手中的高手!
● 之前一直聽您的視頻課,看公眾號收獲特別大。都打印裝訂成冊了,老師你公眾號寫的特別生動,有的不好理解的地方一看您的比喻就豁然開朗了,都是原創的內容,特別有吸引力,真的可以再可以出一本書呢。今天聽機器學習,還是用R和Stata,耳目一新呢,原來比較多的學的Python,上了您的課收獲特別大。
三天的課程內容充實而豐富,機器學習最基本的做法,是使用算法來解析數據、從中學習,然后對真實世界中的事件做出決策和預測。與傳統的為解決特定任務、硬編碼的軟件程序不同,機器學習是用大量的數據來“訓練”,通過各種算法從數據中學習如何完成任務。 本課程主要介紹了機器學習的基本思想與算法,并結合具體案例,介紹Stata和R語言實踐操作。關于機器學習在未來的路上還有更多值得我們去探索和學習的空間,期待陳老師的新書,也歡迎隨時關我們的Stata校園行活動,未來還將繼續推出更多定制和非定制課程。
Stata校園行活動
“Stata校園行活動”是為了促進Stata軟件的應用、提高學員的學習質量和學習效率、推進大數據分析人才培養的寬度和廣度,而開展的高校線下學習活動。內容覆蓋經濟學、金融學、會計學、計算語言學、新聞學、政治學、歷史學、醫藥衛生等微觀和宏觀計量分析的熱門應用領域。主旨順應大數據時代要求,通過活動路演、創新講座等系列活動的舉辦,深度推進國內青年學者學習熱情,提升高校學術交流氛圍,整合學界及業內的大量資源,進一步提高數據分析能力和科學決策的水平。
誠邀國內高校參與“Stata校園行活動”,各高??啥ㄖ菩萐tata實訓班,根據課程內容、知識點、培訓時間、學生水平、培訓對象、授課講師等需求自由定制,屆時敬請各界學者踴躍報名。