Python作為一門面向對象的編程語言,簡潔的語法使得編寫十幾行代碼即可實現爬蟲功能,獲取海量互聯網數據。使用Python來編寫爬蟲實現簡單且效率高,同時爬取的數據可以使用Python強大的第三方數據處理庫來進行分析,最重要的是學習成本低,如此之好的東西怎能不學習呢?
2017年,北京友萬信息科技有限公司聯合雪晴數據網舉辦了三期Python爬蟲與機器學習應用案例研討會,取得了非常好的效果。之后不斷有人詢問我們何時再次舉辦類似的研討會,經過我們的反復調研,對原有的培訓內容做全新升級,定于今年11月16日至18日再次舉辦一期研討會。
時間地點
2018年11月16日-- 18日 廣州市(具體地點報名后通知)
(時間安排:外地參會人員11月15日報到,16日~18日正式會議)
參會對象
從事金融、醫療、保險、生態、衛生、計量、統計、銀行、通信、環境、基金等與數據分析統計相關的企事業單位技術骨干、科研院所研究人員和大專院校相關專業教學人員及在校研究生、碩士、博士等相關人員,以及廣大Python愛好者。
主題安排
我們會根據學員的意愿從案例庫里來選擇案例講解,學員也可以提供自己想要抓取數據的鏈接,老師現場講解。
第一天:python基礎語法和網絡知識簡介 | |
第一講:Python環境的搭建 | 1. 操作系統的配置 2. 安裝anaconda套件 |
第二講:Python基礎語法 | 1. 基本數據結構(列表、字典、元組) |
第三講: 數據導入導出、數據整理與變換 | 1. 使用Pandas模塊導入/導出數據 |
第四講: 可視化與描述性統計 | 1. 餅圖、柱形圖、折線圖、箱線圖 |
第五講: 網絡和網頁基礎知識 | 1. 網絡協議 |
第二天:靜態網站的抓取 | |
第六講:相關Python模塊 | 1. 用Requests模塊獲取網頁 |
第七講: 靜態網站抓取的高級策略 | 1. 尋找目標內容的真正網址 |
第三天:動態網站的抓取 | |
第八講: 通過API接口獲取數據 | 1. 什么是Ajax異步加載 |
第九講: 用Selenium模擬瀏覽器獲取數據 | 1. Selenium的簡介 |
第十講: 疑難問題的應對 | 1. 網站內容定時更新,要怎么自動去抓取 |
講師介紹
陳堰平雪晴數據網創始人,北京友萬信息科技有限公司首席技術官、北京理工大學大數據創新學習中心業界導師團成員,2017年1月獲“微軟最有價值專家”榮譽稱號。曾獲CQF國際數量金融認證,先后任新華社指數中心技術總監、SupStat Analytics中國區首席技術官。在統計咨詢、數據挖掘、開發數據驅動的商業解決方案等領域有近十年的經驗,曾為人保財險、國家統計局、微軟、惠普、野村綜研、德勤咨詢、聯想、豐田、招商銀行、花旗銀行、東方航空、中國移動、中國電信、中國聯通等機構做過數據科學方面的培訓和咨詢。2017 年先后兩次擔任教育部高等學校計算機類專業教學指導委員會主辦的“全國高校大數據系列課程高級研修班”主講老師。
為什么要學爬蟲技術,學了以后有什么好處?
不論您是想要做市場調查、趨勢分析、還是想要做科研,都需要從自己機構外部找數據,但是網站有千百種,從單純的下載文件,到整理成干凈的數據表,數據藏在哪里,要拿甚么鑰匙去敲門,都是透過每個精心設計的范例去學習的。拿到數據之后,不同的數據類型有不同的處理方式,最后怎么有能力說出一個故事,都是這堂課的學習主軸。
網上有很多爬蟲課程,為什么要選雪晴數據網?
市場上真的有各種爬蟲課程,各有各的特色及優點,有的還是免費的,這里我們不比較各自的不同,就說說我們有什么優點吧:
優秀的講師團隊:我們的講師不但有多年的工作經驗,也有豐富的教學經驗,不但技術過硬,也善于用通俗的語言講解復雜的知識點,更有耐心為學員解答學習過程中的問題。每次課程我們都會反復研究,花大量時間準備課程材料,力求用最適合的案例和方式為學員講解。
參會費用
在職人員3200元,學生2500元(可開具正規發票),此價格含會議注冊費、資料費、午餐費、場地費。食宿費用自理。
優惠政策
雪晴數據網、友萬科技的老學員8折優惠
參與北理工大數據創新學習中心活動9折優惠
三人以上同時報名9折優惠
五人以上同時報名8折優惠
報名方式
請前往http://t.cn/RmyEZvz(復制瀏覽器打開)填寫報名表,我們的工作人員隨后會聯系您。確認報名后,請通過以下三種支付方式中的一種來繳費(請保留支付憑證,拍照或截圖發給我們的工作人員):
方式一: 對公轉賬
開戶名 繪辰科技(北京)有限公司
開戶銀行 中國工商銀行股份公司北京大鐘寺東路支行
賬號 0200151609100034763
方式二: 支付寶
賬號 pay@xueqingtv.com
戶名 繪辰科技(北京)有限公司
方式三: 現場繳費
外地學員請于11月15號提前報到,廣州學員可于16號早上8點~8點半報到,繳費并領取發票和紙質邀請函,以及上課教材。
由于16號早上現場人比較多,鼓勵北京學員也于15號報到。
主辦機構
主辦方:
雪晴數據網
協辦方:
北京友萬信息科技有限公司
北理工大數據創新學習中心
北京友萬信息科技有限公司,簡稱:友萬科技。英文全稱:Beijing UoneInfo&Tech Co.,Ltd,( Uone-Tech )是中國大陸領先的教育和科學軟件分銷商,已在中國300多所高校建立了可靠的分銷渠道。擁有最成功的教學資源和數據管理專家。微信搜索友萬科技官方公眾號“友萬軟件”關注我們,隨時了解最新的大數據科學及相關線上線下活動,感謝你的關注。