巨量資料分析應用與實作班

打造出一個巨量資料推薦系統,讓使用巨量資料分析掏金,不再遙不可及

適合對象:
主辦單位:財團法人工業技術研究院 台北學習中心 

當巨量資料已經蔚為趨勢,學習該如何有效駕馭巨量資料,解決商業問題,便成為各企業開拓未來商機的新藍海。而Hadoop Ecosystem 即是為了解決巨量資料問題而生,透過平行運算跟分散式儲存,讓掌控巨量資料變得相當容易。但如何從巨量資料有效掏金,則需要藉重分析的技巧。本課程將著重在使用Hadoop Ecosystem 架構資料分析平台,並實際讓學員對手打造出一個巨量資料推薦系統,讓使用巨量資料分析掏金,不再遙不可及。
 
課程特色
本課程將學習到如何使用Hadoop Eco System 的工具進行資料蒐集、過濾、分析、視覺化,進一步實踐完整的推薦系統。
課程時間
課程單元
課程主題
Day1
5/13(三) 9:30~16:30
資料科學與資料分析基礎
●資料分析概論
●巨量資料分析所面臨到的問題
●解決巨量資料分析的方法與工具
資料擷取(Data Acquisition)
●資料擷取(Data Acquisition) 概論
●整合資料工具 Sqoop & Flume
●如何使用Sqoop 蒐集結構化資料
●如何使用Flume 蒐集非結構化資料
●整合網頁資料擷取工具(Nutch)與巨量資料分析平台
●資料擷取實作
資料評估(Data Evaluation)
●資料評估(Data Evaluation) 概論
●XML, CSV, JSON 等異質格式資料處理
●資料過濾與取樣
●視覺化資料探索
●使用Apache Avro 序列化與交換資料
●資料評估實作
Day2
5/20(三)
9:30~16:30
資料轉換(Data Transformation)
●資料轉換(Data Transformation)概論
●資料轉換與分析工具- Pig & Hive
●使用Pig 進行資料轉換與分析
●使用Hive 進行資料轉換與分析
●使用Hadoop Streaming 進行資料轉換
●資料轉換實作
資料視覺化
(Data Visualization)
●資料轉換(Data Visualization)概論
●可視化工具及圖表簡介 - Pentaho BI
●定期使用Sqoop 將資料轉移至資料庫
●透過ETL程序批次建立範例報表
●資料視覺化實作
Day3
5/27(三)
9:30~16:30
Mahout與機器學習
●Mahout與機器學習概論
●機器學習基礎
     -迴歸分析 (Regression)
     -資料分類 (Classification)
     -資料分群 (Clustering)
     -降低維度 (Dimension Reduction)
●使用Mahout 進行機器學習
●Mahout與機器學習實作
推薦系統實作
●推薦系統概論
●Item-based 與User-Based推薦系統
●Collaborative – Filtering 演算法介紹
●使用Mahout 建立推薦系統
●推薦系統實作
 
課程對象
●適合對象
1. 企業資料分析部門主管及相關人員
2. 專案經理、系統架構師或系統網路管理人員
3. 對於巨量資料(Big Data)處理、分析、應用有興趣者
●預備知識
1. 具Linux 實務及Java程式語言經驗基礎
2. 具Hadoop 基礎知識者尤佳
 
講師簡介
丘祐瑋 講師   現任:大數軟體有限公司 執行長
●專長
 R, Python, Hadoop Ecosystem, BI, Database, ,Data Mining,
    Machine Learning, Front-end development
●演講課程
 資策會數位教育研究所
 精誠資訊 (ETU)
 聚碩教育訓練
 資料科學計畫 - DSP
●相關著作
 作者:“Yu, Wei, Chiu: Machine Learning With R Cookbook, Packt publisher”
 評論者“Paurush Praveen: Bioinformatics with R Cookbook, Packt publisher”

價格

加入工研院產業學院會員(http://college.itri.org.tw/LoginMember.aspx)

可以保存您的學習紀錄、查詢及檢視您自己的學習歷程,未來有相關課程,可優先獲得通知及更多優惠!

 

課程費用

課程原價-非會員(每人)

$12,000

課程原價-會員(每人)

折抵勤學點數(1,000點)
$11,000

開課前十日報名完成或兩人團報
非會員(每人)

$11,500

開課前十日報名完成或兩人團報
會員(每人)

折抵勤學點數(1,000點)
$10,500


常見問題

●舉辦地點:工研院產業學院 台北學習中心,實際地點依上課通知為準!
●舉辦日期:2015/5/13(三) & 5/20(三) & 5/27(三)9:30~16:30,共計18小時
●課程名稱:巨量資料分析應用與實作班
●報名方式:請以正楷填妥報名表傳真至 (02) 2381-1000 或 email至charming@itri.org.tw
●課程洽詢:(02) 2370-1111 #317 梁小姐

貼心提醒

1. 為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢方完成報名。
2. 因課前教材、講義及餐點之準備及需為您進行退款相關事宜,若您不克前來,
    請於開課五日前告知,以利行政作業進行並共同愛護資源。
3. 若原報名者因故不克參加,欲更換他人參加,敬請於開課前二日通知。


 

附件

DM_巨量201505.pdf        

※注意事項※ 為確保您的上課權益,報名後若未收到任何回覆,請來電洽詢方可完成報名


開課1

標記

經歷:

大數軟體有限公司 執行長

>>詳細介紹

簡介


產業學院緣起
  依據行政院「挑戰2008:國家發展重點計畫」下之「國際創新研發基地」與「產業高值化」兩計畫,首重產業科技人才的效能。

•911216經科字第09103373120號函:經濟部將本院籌設工研院產業學院之工作,列為因應產業結構轉型,提