目前位置: 首頁 > 公開課程 > 資訊管理 > 企業e化 > 資策會「大數據資料分析-進階R語言與機器學習」

資策會「大數據資料分析-進階R語言與機器學習」

真正使用 R 語言處理與分析超出單機記憶體能處理的資料量及平行化 R機器學習!

  大數據的處理與分析已成為資訊科技、商業經營、科學研究相關從業人員所需的技能。而許多經典的統計或機器學習的方法、範例、甚至於教材都是使用 R 語言來實作與開發,這使得R 語言成為一個專業數據科學家必需掌握的程式語言。而隨著近年來學習R語言的熱門,相關的課程與書籍也相繼推出。可惜的是,坊間的教材多數只討論基礎 R 語言的單機(Single-node)或單線程(Single-threaded)的資料分析方法,很少討論進階 R 語言的平行化、分散式、與CPU-GPU 異質化等運算,以致於無法真正使用 R 語言處理與分析超出單機記憶體或 CPU核心數能處理的資料量。

加入收藏
收件人email:
寄件人姓名:
寄件人email:
適合對象:中小企業負責人 、高階主管 、中階主管 、專業人員 、技術人員 、一般職員 、職場新鮮人 、二度就業者 、轉職者
◆ 課程緣起

大數據的處理與分析已成為資訊科技、商業經營、科學研究相關從業人員所需的技能。而許多經典的統計或機器學習的方法、範例、甚至於教材都是使用 R 語言來實作與開發,這使得R 語言成為一個專業數據科學家必需掌握的程式語言。而隨著近年來學習R語言的熱門,相關的課程與書籍也相繼推出。可惜的是,坊間的教材多數只討論基礎 R 語言的單機(Single-node)或單線程(Single-threaded)的資料分析方法,很少討論進階 R 語言的平行化 (Parallel)、分散式(Distributed)、與CPU-GPU 異質化(Heterogeneous)等運算,以致於無法真正使用 R 語言處理與分析超出單機記憶體或 CPU核心數能處理的資料量

藉由龐大的開放原始碼社群支援,R 語言已有許多相關的套件支援多線程(multi-threaded)、平行化、GPU運算、與其它高效能(High-Performance)的資料分析。資策會高雄特別針對已有 R 語言程式設計經驗的學員規劃進階R課程,『Big Data 資料分析-進階R 語言與機器學習』。課程將帶領學員們從簡單的MapReduce 設計模式(Design Patterns)、平行化的機器學習與資料分析方法、如何處理GB 以上或超過主憶體大小的資料、R 語言的深度學習入門、到討論最新可擴展 (Scalable)的 R大數據分析套件使用。也讓學員們未來能使用 R 語言輕鬆完成無論是小型的統計資料分析或是大規模的資料探勘工作

 ◆ 課程目標

本課程教導學員使用R 與RStudio軟體進行大數據分析。我們將快速復習 R 語言的語法與資料分析基本概念,輔以 R 語言中的 Split-Apply-Combine與 MapReduce資料分析策略。並以此分析策略為基礎,討論 R 語言的機器學習實務應用與如何實作R 語言的特徵學習與工程來設計與選擇最適合的模型。此外,本課程也將介紹實務上如何使用 R 語言處理大數據與探討高效能的 R 程式設計, 內容包括 R 的向量化運算、函數式程式設計、In-Memory & In-Database Computing,R 深度學習套件、與快速可擴展 (Fast & Scalable) 的R 與 H2O大數據分析.

 ◆ 適合對象
  • 已有R 語言程式設計基礎,希望修習進階課程者。

  • 有企業營運資料分析實務經驗的部門主管,程式設計師、或決策人員。

  • 有實務經驗的資料庫管理、資料庫開發、或商業智慧分析師。

  • 有科學計算或統計分析經驗,希望修習 R 語言者

預備知識:已有R 語言程式設計基礎或修習過Big Data資料分析-R軟體實作課程

 ◆ 課程內容
   

課程單元

課程內容

語言與分散式資料分析
  • 語言與資料分析基礎

  • Split-Apply-Combine 分析策略與MapReduce 程式設計

  •  MapReduce 設計模式 (Design Patterns)

R 語言與機器學習
  • 語言與模型思考 (Model Thinking)

  • 語言中的特徵工程(Feature Engineering) 與特徵學習(Feature Learning)方法

  • 機器學習基礎KNN 廣義線性模型(Generalized Linear Models)CART決策樹為例

  • 進階機器學習隨機森林(Random Forest)與整合學習(Ensemble Learning)介紹

高效能R 程式設計 
(High-Performance R Programming)
  •  語言效能探討

  • 的向量化(Vectorization)與函數式程式設計(Functional Programming)

  • 進階資料處理分析使用 data.table,  dplyr,  bigmemory套件為例

  • 快速與可擴展的R大數據分析使用 R  H2O、與Apache Spark

  • 語言與深度學習基礎使用 MXNet

課程 *課程執行單位保留調整課程內容、日程與講師之權利*



報名截止日:2018/01/26

開課日:2018/01/27結束日:2018/01/28定價: 請來電洽詢

時數:12 (小時) 時段:週六日 09:30 ~ 16:30

地點:高雄 | 資策會數位教育研究所高雄教室 | 高雄市前金區中正四路211號8F-1 [看地圖]

簡介

資策會數位教育研究所成立於1979年,全所員工上百人,為全國第一家通過ISO9000認
證之教育訓練機構,TTQS評核為「標竿訓練機構」,連續多年獲選為「MIS Best
Choice教育訓練機構」,為國內各產業培育資通訊技術、管理與應用之專業人才。此
... more

*填寫報名表能讓開課單位更有效的處理您的資料,並優先處理您的需求!


三聯式 二聯式


(重新產生)