課程內容
AI如火如荼發展,各大產業對於巨量資料分析人才都存在龐大需求。iPAS產業人才能力鑑定是經濟部為充裕產業升級所需人才, 整合產官學研所建立的鑑定體制。有專業能力認證,更容易獲得企業優先面試/聘用及加薪之機會。艾鍗學院授課講師皆取得iPAS認證,章章精彩、片刻不冷場,帶給學員最實戰的應試指南,打穩巨量資料分析師的基本功!
學習目標
1. 熟悉Python程式語言與Python物件導向設計。
2. 熟悉Python原生的資料結構操作,如tuple, list, dict, set等。
3. 機器學習的概念(監督式學習、非監督式學習)。
4. 資料特徵與資料預處理方式。
5. 知道如何使用Scikit Learn 套件進行實作。
6. 了解迴歸與最小平方法。
7. 了解基本的機器學習分類演算法, 如決策樹、隨機森林等。
8. 了解機器學習分群演算法, 如K-means, 階層式分群法。
9. 熟悉Python常用的資料處理套件,如Pandas, Numpy, Matplotlib。
10. 從提供的iPAS 中級實作題解答中,了解更多實作技巧。
章節架構
初級
Part1.資料導向程式設計
• 1.Python實作基礎
o Python 簡介
o 變數與動態資料型別
o 運算式
o 序列資料結構- list, tuple, range
o 非序列資料結構-set, dict,…
o 流程控制
o 自訂函數
o 變數命名空間
o 例外處理
o 物件導向設計
o 模組與套件
o 資料匯入與匯出(txt,csv,JSON,pickle)
o 附錄: Anaconda 安裝與使用
Part2.機器學習簡介與資料處理
• 1.人工智慧簡介
• 2.機器學習簡介(監督式學習、非監督式學習)
•
• 3.資料與特徵
•
• 4.資料預處理使用Scikit-learn
•
• 5.其他
o Z-score 標準化
o 資料庫概念(含NoSQL)
中級
Part3.機器學習實務
• 1.Introduction to Machine learning & Terminology
• 2.Linear Regression
o Gradient Descent from scratch
o Linear Regression from scratch
o ridge vs lasso regression
• 3.Machine learning using Scikit-learn
• 4.Linear Regression using Scikit-learn
• 5.Classification
o Logistic Regression
o KNN
o Decision Tree
• 6.Dimensionality reduction - PCA
• 7.Ensemble Method
•
o Random Forest
o Adaboost
• 8.Clustering
o K-means
o Hierarchical Method
• 9.Reinforcement Learning
o Q-learning Algorithm & Implementation
•
• @ 進階資料處理 (Python常用資料處理套件)
•
o 資料矩陣運算-使用Numpy
o 資料庫匯入-使用Pandas
o 資料視覺化-繪圖與製表-使用Matplotlib
Part4 iPAS巨量資料分析試題
• 1.中級巨量資料分析師能力觀念題
• 2.術科試題 - 文字資料處理
o 透過程式產生重複資料
o JSON 格式之載入與轉換
o 取出描述內容包含字串「Limited」之商品資料
o 字串處理技巧
o 將商品描述(describe)透過結巴斷詞並計算詞頻 排行
• 3.術科試題解析 - 集群與視覺化
o 讀取資料
o 次數分配表
o k-means 集群
o 分組計算
o 資料視覺化
• 4.術科試題解析 - 隨機森林迴歸預測模型
o 讀取資料
o 切分訓練集與測試集
o 模型配適
o 預測
o 評估
• 5.術科試題解析 - 隨機森林分類預測模型
o 讀取資料
o 切分訓練集與測試集
o 模型配適
o 預測
o 評估