104學習精靈

全部 課程 貼文 教室 證照 影片
巨量資料分析相關的課程 (4)
從工作推薦課程
iPAS巨量資料分析考照班
AI如火如荼發展,各大產業對於巨量資料分析人才都存在龐大需求。iPAS產業人才能力鑑定是經濟部為充裕產業升級所需人才, 整合產官學研所建立的鑑定體制。有專業能力認證,更容易獲得企業優先面試/聘用及加薪之機會。艾鍗學院授課講師皆取得iPAS認證,章章精彩、片刻不冷場,帶給學員最實戰的應試指南,打穩巨量資料分析師的基本功! 學習目標 1. 熟悉Python程式語言與Python物件導向設計。 2. 熟悉Python原生的資料結構操作,如tuple, list, dict, set等。 3. 機器學習的概念(監督式學習、非監督式學習)。 4. 資料特徵與資料預處理方式。 5. 知道如何使用Scikit Learn 套件進行實作。 6. 了解迴歸與最小平方法。 7. 了解基本的機器學習分類演算法, 如決策樹、隨機森林等。 8. 了解機器學習分群演算法, 如K-means, 階層式分群法。 9. 熟悉Python常用的資料處理套件,如Pandas, Numpy, Matplotlib。 10. 從提供的iPAS 中級實作題解答中,了解更多實作技巧。 章節架構 初級 Part1.資料導向程式設計 • 1.Python實作基礎 o Python 簡介 o 變數與動態資料型別 o 運算式 o 序列資料結構- list, tuple, range o 非序列資料結構-set, dict,… o 流程控制 o 自訂函數 o 變數命名空間 o 例外處理 o 物件導向設計 o 模組與套件 o 資料匯入與匯出(txt,csv,JSON,pickle) o 附錄: Anaconda 安裝與使用 Part2.機器學習簡介與資料處理 • 1.人工智慧簡介 • 2.機器學習簡介(監督式學習、非監督式學習) • • 3.資料與特徵 • • 4.資料預處理使用Scikit-learn • • 5.其他 o Z-score 標準化 o 資料庫概念(含NoSQL) 中級 Part3.機器學習實務 • 1.Introduction to Machine learning & Terminology • 2.Linear Regression o Gradient Descent from scratch o Linear Regression from scratch o ridge vs lasso regression • 3.Machine learning using Scikit-learn • 4.Linear Regression using Scikit-learn • 5.Classification o Logistic Regression o KNN o Decision Tree • 6.Dimensionality reduction - PCA • 7.Ensemble Method • o Random Forest o Adaboost • 8.Clustering o K-means o Hierarchical Method • 9.Reinforcement Learning o Q-learning Algorithm & Implementation • • @ 進階資料處理 (Python常用資料處理套件) • o 資料矩陣運算-使用Numpy o 資料庫匯入-使用Pandas o 資料視覺化-繪圖與製表-使用Matplotlib Part4 iPAS巨量資料分析試題 • 1.中級巨量資料分析師能力觀念題 • 2.術科試題 - 文字資料處理 o 透過程式產生重複資料 o JSON 格式之載入與轉換 o 取出描述內容包含字串「Limited」之商品資料 o 字串處理技巧 o 將商品描述(describe)透過結巴斷詞並計算詞頻 排行 • 3.術科試題解析 - 集群與視覺化 o 讀取資料 o 次數分配表 o k-means 集群 o 分組計算 o 資料視覺化 • 4.術科試題解析 - 隨機森林迴歸預測模型 o 讀取資料 o 切分訓練集與測試集 o 模型配適 o 預測 o 評估 • 5.術科試題解析 - 隨機森林分類預測模型 o 讀取資料 o 切分訓練集與測試集 o 模型配適 o 預測 o 評估
艾鍗學院