活用PyTorch的電腦視覺設計實務
本課程兼顧理論及實作,以手把手的教學方式由淺入深,引領學員學習PyTorch..
提供機構:
適合對象:
|
課程介紹PyTorch 為 Facebook 在 2017 年初所開放出來的深度學習框架,其語法是為 Python 語言量身所打造,使用起來就跟寫一般 Python 專案一樣簡潔優雅、對於模型定義十分直觀易懂,概念也比TensorFlow直觀且容易上手,同時能和其他 Python 套件無痛整合,因此一推出便迅速走紅,儼然已成深度學習的最佳框架。眾所皆知,Python的寫法相當具有靈活且彈性,而PyTorch的開發者也是希望使用者可以輕鬆地透過此框架來搭建神經網路,也能輕鬆無痛結合其他Python的Library (如: Numpy)。PyTorch還有一大優點,輕鬆地切換CPU/GPU,透過GPU加速神經網路的訓練時間。因其模型網路設計的靈活性,受到大量的初學者及研究者所喜愛,在2019年發布的相關論文中,PyTorch達到60%的使用比例。
在深度學習的範疇中,有很大一部份在圖像的領域上,舉凡圖像識別,例如: 貓狗辨識;又或者是物件偵測,如: 人臉偵測。這類案例都是要先將圖片做前處理(pre-process),將輸入圖片整理成統一個規格,進而丟進深度學習模型做訓練。好的前處裡可以有效的提升訓練效率,甚至能提升準確度(Accuracy)。因此前處理的操作,在深度學習中也是佔了相當重要的一部份。
OpenCV (Open Source Computer Vision Library),是一個集合數百種演算法的跨平台電腦視覺資料庫,包含了電腦視覺 (Computer Vision)、機器學習及影像處理演算法的集合,可用於開發即時的圖像處理、電腦視覺以及圖型識別程式,針對影像做辨識、操作、分析等絕佳的輔助工具,目前已經是大部分影像處理使用者必備的函式庫。
Yolo 系列 (You only look once, Yolo) 是關於物件偵測 (object detection) 的類神經網路演算法,以小眾架構 darknet 實作,實作該架構的作者 Joseph Redmon 沒有用到任何著名深度學習框架,輕量、依賴少、演算法高效率,在工業應用領域很有價值,例如行人偵測、工業影像偵測等等。
本課程兼顧理論及實作,以手把手的教學方式由淺入深,引領學員學習PyTorch的操作,講述其核心概念,並結合影像處理(OpenCV),帶您親手實現多種電腦視覺深度學習經典案例及進階設計,讓學員更能掌握將電腦視覺應用於自己的專業領域上。
課程特色/目標本課程分為兩天的課程,第一天介紹現今當紅的深度學習框架-PyTorch,講解其基本至進階之操作,從機器學習衍生至深度學習,搭建簡單的神經學習網路。 第二天介紹AI電腦視覺領域常用的OpenCV,以及如何透過OpenCV來做到資料擴增(Data Augmentation),了解OpenCV在人工智慧(AI)上扮演何種角色。 最後實作兩個題目,圖像分類及人臉辨識,清楚的理解神經網路模型的運作,並透過準備資料集以及自己手動標註資料,從資料處理到神經網路的訓練,從無到有的手把手教導。 |
課程對象
講師簡介鍾幸芸 / 工研院工程師 ( NVIDIA DLI認證講師)
【學歷】
�� 國立交通大學資訊工程研究所博士班在學
�� 國立交通大學生物資訊研究所碩士
【經歷】
�� 工研院機械所,鑽研於智慧型自動光學檢測系統研發等
�� NVIDIA 深度學習機構(DLI) 認證講師: Computer Vision, CUDA
�� 擔任計算機概論、人工智慧、數位遊戲學習等課程助教
【專業領域】
�� 機器學習、影像處理、機器視覺瑕疵檢測、平行運算
呂冠霆 / 工研院 副工程師 (NVIDIA DLI Computer Vision完訓)
【學歷】
�� 國立交通大學資訊工程研究所碩士
�� 國立彰化師範大學資訊工程學系學士
【經歷】
�� 工研院資通所,影像處理,瑕疵偵測等
�� 擔任交大大學部人工智慧課程助教
【專業領域】
�� 機器學習、影像處理、機器視覺瑕疵檢測、深度學習
|
課程大綱
第一天:從ML基礎到 PyTorch 影像處理 |
附件 |
活用PyTorch的電腦視覺設計實務-20201125.pdf |