Python網路爬蟲與資料分析技術實作
本課程會先介紹HTML基本的原理並使用Python爬取許多網頁上之數據...
在大數據的時代,巨量的資料往往蘊藏了許多有用的價值。然而,如何有效地蒐集網路上不同的數據並加以分析,是資訊時代裡每個人不可或缺的基本能力,也是進入許多企業之基本門檻。
時數:12 起迄日期:2020-09-23~2020-09-24 聯絡資訊:楊小姐/03-5732978 報名截止日:2020-09-18 課程類別:人才培訓( 課程含線上同步數位學習) 活動代碼:2320040038 |
|||||||||||||||||||||
課程介紹 在大數據的時代,巨量的資料往往蘊藏了許多有用的價值。然而,如何有效地蒐集網路上不同的數據並加以分析,是資訊時代裡每個人不可或缺的基本能力,也是進入許多企業之基本門檻。
本課程會先介紹HTML基本的原理並使用Python爬取許多網頁上之數據,再利用一連串分析工具過濾出有用的資訊,藉由一連串理論的介紹及實際的操作,最後會帶學生動手打造一個自動擷取數據之平台。
課程目標 1.了解爬蟲的基本原理
2.了解瀏覽器的運作原理
3.熟悉網路爬蟲分析的流程
4.學會爬取網路上有用的資訊
1. 對大數據、資料分析工作有需求/興趣者課程對象 2. 使用Python軟體進行資料蒐集、過濾、分析等工作者 3. 企業資訊人員、企劃/行銷分析人員等 講師簡介 李老師 業界資深AI講師
畢業於台灣大學電子工程所。
專長在於人工智慧、資料分析、影像辨識、金融數據等議題,是台積電、中華電信、富邦銀行、新思科技等上市櫃公司企業內訓AI講師。
課程大綱
一、Python語法複習與Pandas模組介紹
*Python語法複習
*Pandas模組介紹
二、網頁基礎原理
*瀏覽器原理
*HTML/CSS/Jquery基礎
三、Python網路爬蟲
*GET/POST介紹
*Beautifulsoup解析HTML
*Regular expression解析HTML
四、爬蟲實務上遇到的問題
*表格式資料爬取
*大量爬取網頁
*驗證碼處理
*定時爬取網路資訊
五、資料儲存與分析
*SQLite介紹
*基礎資料分析
先備知識 1. Python基礎語法
2. 學員須自備筆電,電腦為64位元,建議記憶體至少8G,作業系統Windows, Mac, Linux皆可。
本課程原價10,000元整。課程費用 報名【實體課程】,費用含課程講義、茶點、午餐、稅
早鳥價(開課十天前報名)或工研人優惠價:每人$7,800 元
團報價(同企業兩人以上同行):每人$7,500 元
報名資訊 一、主辦單位:財團法人工業技術研究院 產業學院
二、舉辦地點:工研院 台北學習中心 (實際上課地點請以上課通知單為準!)
三、舉辦日期:109 年09 月23 日(四) ~ 09 月24 日(五) 09:30-16:30,兩天共12 小時。
四、培訓證書:完成課程學習後頒發工研院培訓證書。
五、報名方式:工研院學習服務網,線上報名:http://college.itri.org.tw/
六、課程洽詢:03-5732978 楊小姐,vickyyang@itri.org.tw
七、注意事項:
1. 為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢方完成報名。
2.因課前教材、講義及餐點之準備及需為您進行退款相關事宜,若您不克前來,請於開課前3日以E-mail或電話通知主辦單位聯絡人確認申請退費事宜。學員於開訓前退訓者,將依其申請退還所繳上課費用90%,另於培訓期間若因個人因素無法繼續參與課程,將依上課未逾總時數1/3,退還所繳上課費用之50%,上課逾總時數1/3,恕不退費。若原報名者因故不克參加,但欲更換他人參加,敬請於開課前三日通知。
3. 若原報名者因故不克參加,欲更換他人參加,敬請於開課前三日通知!
~本課程歡迎企業包班!~
〈AI系列〉課程推薦
|
|||||||||||||||||||||
|
簡介
產業學院緣起
依據行政院「挑戰2008:國家發展重點計畫」下之「國際創新研發基地」與「產業高值化」兩計畫,首重產業科技人才的效能。
•911216經科字第09103373120號函:經濟部將本院籌設工研院產業學院之工作,列為因應產業結構轉型,提 ... more