「資料探勘」在職進修、線上學習、共學教室

每日推薦一堂課

關注

一零四線上嚴選

小編

2022/10/08

[AI關鍵技能：資料探勘] 一步到位_原理、分類及聚類演算

這兩週連續介紹兩個AI關鍵技術，本週是另一個關鍵技術「資料探勘」；

這兩週所分享的機器學習與資料探勘，可以做到的不只是 AlphaGO 所能做到的與人類下棋，更可以擴大應用範圍至網路電商的商品推薦、製造業的自動化製造流程等，所以會被視為關鍵技術。

本週課程專門針對「資料探勘」來分享；本課程我們可以獲得以下知識技能：資料探勘的原理、關聯規則原理與實務、分類原理、聚類原理、平均聚類演算法、階層聚類技術、DBSCAN密度式聚類法等。

那需要如何依序學習呢？課程將分為三大部分進行教學，分別為：資料探勘概論及關聯規則、分類概念與技術、聚類概念與技術。

第一部分資料探勘部分，老師從學習方法開始分享，讓我們往後接觸時，可以快速掌握；接下來就會定義資料探勘的意義，以了解其重要性。之後，將會帶我們知道目前主要技術有哪些、各自在哪些地方應用、業界常用的專業用語；，在第一部份下半段，會開始學習Apriori 及 FP-Growth 兩種演算法；透過兩種演算法所獲得的資料支持度與信賴度該如何看。

第二部分及第三部份分別要學分類與聚類概念；將會以演算法帶大家了解分類與聚類演算法；除了演算法的部分是必要的技術外，還會學習如何衡量分類模型準確性、決策樹、屬性選擇指標、屬性分割等。

這門課程希望參與的學員能夠一次帶領大家學會資料探勘所有觀念及技術。

推薦課程網址：

https://www.tibame.com/course/49

祝您工作順利、學習愉快

104學習精靈小編陪您每日學習成長1%

0 0 377 0

拍手

留言

分享到：

Line

Facebook

複製連結

取消

熱門精選

新鮮人求職攻略🔥 找工作與技能養成請進

關注

陳立婕

產品行銷專案經理

04/18 12:31

🔥104人力銀行「2024職涯博覽會」開始報名啦📢

一年就這一次！應屆預備找工作搶先報名 👉 https://tw104.pse.is/5u86r4

微軟、緯穎、德州儀器、遊戲橘子、東京威力科創、KPMG、IKEA、星巴克、宜得利、迪卡儂等，上百家頂尖知名企業現場徵才🤩

📍 6/15(六) 資訊科技、顧問金融業

企業名單看這邊➡️ https://tw104.pse.is/5u834l

📍 6/16(日) 電子製造業、零售服務業

企業名單看這邊➡️ https://tw104.pse.is/5u83bn

連續兩日，優質企業將在現場釋出數千個工作機會💼

另有中高階獵才、職涯諮詢、趨勢論壇、夜fun職場等系列活動，

主題精采多元，除部分講座收費，其餘活動皆免費！免費！免費！

心動不如立即搶先報名👉 https://tw104.pse.is/5u86r4

tw104.pse.is

104人力銀行－「青春無畏後生可敬」2024 職涯博覽會｜104職場力

1 2 3045 0

拍手

留言

分享到：

Line

Facebook

複製連結

取消

104學習精靈精選課程

看更多課程

想提升職場競爭力？專業技能課程看起來👇

零基礎Python入門與資料科學

緯育TibaMe

Python零基礎必修實作班

課程說明：上課時間：本課程的明確目標，就是讓程式零基礎的朋友，可以迅速掌握以下基礎能力，立即上手，將所學實際運用在工作上，建立興趣與信心，並為深入商業數據分析，奠定紮實穩固的根基。課程目標： ‧ 建立 Python 工作環境 ‧ 認識 Python 基本變數與容器 ‧ 瞭解 Python 基本語法與指令 ‧ 熟悉 Python 控制流程與函數 ‧ 掌握程式編寫流程 ‧ 動手使用數據分析核心套件NumPy、Pandas、Matplotlib ‧ 實作機器學習並判讀結果

商研院

人工智慧-Python與資料科學

這是一門有別於坊間的AI數位課程，不僅有清楚的觀念說明也有詳細的程式解說。教你Python程式並瞭解如何實際進行資料處理。本課程以「程式打底」為目標，教授Python語言及以Numpy、Pandas、Matplotlib進行資料處理與分析。學習目標【Python與資料科學】 1. 能快速熟悉Python語言的核心與Python常用的資料結構 2. 學會運用資料科學常用套件-Numpy、pandas、matplotlib來處理、分析與圖表化資料 3. 機器學習的設計方法與術語-從迴歸(Regression)方程式認識機器學習的基本精神 4. 能不使用任何工具套件，以Python實作迴歸方程式 ※ 課程適用經濟部iPAS巨量資料分析師/機器學習工程師能力鑑定考試準備章節架構 ►Python 簡介 ►變數與動態資料型別 ►運算式 ►序列資料結構- list, tuple, range ►流程控制 ►更多資料結構-set, frozenset, dict, byte, bytearray ►函數 ►變數命名空間 ►類別設計 ►例外處理 ►模組與套件 ►輸入輸出與檔案處理(txt,csv,JSON, pickle) ► 其他(https urlib、beautifulshop,…) ► 附錄: Anaconda Windows/Linux安裝與使用 ►conda 套件管理 ►conda 虛擬環境 ►ipython interpreter ►jupyter notebook ►資料矩陣運算使用Numpy ►資料匯入匯出使用Pandas ►繪圖與製表使用Matplotlib ►機器學習概念 ►最佳化演算法: Gradient Descent ►手刻Gradient Descent演算法 ►手刻線性迴歸 ►手刻線性迴歸作(矩陣版)

艾鍗學院

R語言/R-Studio入門─統計分析、資料探勘與機器學習的原理與實戰演練

R語言是開源的統計程式語言，常用於開發統計、資料分析軟體系統，課程中我們將從R/R-Studio入門，從統計分析、資料探勘與機器學習的原理與技巧，讓學員有能力進行相關的資料分析技術與資料視覺化整合應用。本門課適合想瞭解R語言，作為進入大數據分析基礎，或進行量化研究、進階資料視覺化。

緯育TibaMe

iPAS機器學習工程師考照班

AI即未來！各大產業離不開機器學習，人工智慧如火如荼發展，整個產業勢必向智慧化靠攏， AI人才需求也倍數增長！iPAS產業人才能力鑑定是經濟部為充裕產業升級所需人才，整合產官學研所建立的鑑定體制。有專業能力認證，更容易獲得企業優先面試/聘用及加薪之機會。艾鍗學院授課講師皆取得iPAS認證，章章精彩、片刻不冷場，帶給學員最實戰的應試指南，打穩機器學習工程師的基本功！學習目標 1. 帶你了解機器學習產業發展趨勢及應用方向 2. 養成資料特徵與資料預處理能力，並能運用探索式資料分析(EDA)，洞悉數據關聯性。 3. 教你機器學習和深度學習的專業術語與觀念，並能了解其背後的意義及數學意義。 4. 漸進式熟悉機器學習演算法與模型建立流程，後續模型訓練成效之驗證。 5. 從提供之iPAS樣題詳細解析中，了解更多觀念與實作技巧章節架構初級 Part 1. 機器學習觀念打底 Section A：資料處理分析與特徵選擇 1. 人工智慧與機器學習簡介 2. 機器學習如何進行學習 3. 資料與特徵 4. 機器學習建立模型的流程 5. 探索式資料分析(EDA)與資料預處理方法 6. 如何挑選好的特徵? Feature Selection v.s. Feature Extraction Section B：監督式機器學習演算法 1. 迴歸模型: 線性迴歸▼ iPAS ML linear regression Ridge v.s. Lasso 線性迴歸評估迴歸模型的性能指標 2. 分類模型: Logistic Regression 演算法 KNN 演算法決策樹演算法 SVM 演算法與數學原理評估分類模型的性能指標 3. Ensemble Method Random Forest隨機森林 Adaboost Section C：非監督式機器學習演算法 1. 降維: PCA 演算法▼ iPAS ML The Algorithm of PCA c 2. Clustering: K-means 演算法 Hierarchical Method 演算法 3. 強化學習強化學習的架構 Q-learning 演算法 Section D：深度學習 1. 深度學習技術簡介 2. 類神經網路運算模型原理 3. 深度學習建立模型的流程 4. 深度學習框架TensorFlow/Keras 程式架構說明 5. 其他網路結構簡介：RNN/LSTM、CNN Part 2. Python實作機器學習 1. 資料處理工具: Numpy、Pandas▼ iPAS ML Pandas 2. 視覺化工具: Matplotlib▼ iPAS ML Matplotlib c 3. 機器學習工具:Scikit-learn 4. 迴歸模型實作 y=f(x) 的函式預測價格預測模型 5. 鳶尾花花卉分類與探討▼ iPAS ML iris 使用Logistic Regression 使用KNN 使用Decision Tree▼ iPAS ML Decision Tree 使用SVM▼ iPAS ML SVM 使用Random Forest 使用Adaboost 6.PCA 降維使用Scikit-learn▼ iPAS ML PCA降維使用Scikit learn 7.K-means分群使用Scikit-learn▼ K means分群使用Scikit 8.Hierarchical方法分群使用Scikit-learn▼ iPAS ML Hierarchical Scikit learn 9.強化學習-找寶藏地圖實作解析▼ iPAS ML Reinforcement learning iPAS ML Q learning value function Part 3. iPAS機器學習工程師範例試題詳解

課程說明：上課時間：本課程的明確目標，就是讓程式零基礎的朋友，可以迅速掌握以下基礎能力，立即上手，將所學實際運用在工作上，建立興趣與信心，並為深入商業數據分析，奠定紮實穩固的根基。課程目標： ‧ 建立 Python 工作環境 ‧ 認識 Python 基本變數與容器 ‧ 瞭解 Python 基本語法與指令 ‧ 熟悉 Python 控制流程與函數 ‧ 掌握程式編寫流程 ‧ 動手使用數據分析核心套件NumPy、Pandas、Matplotlib ‧ 實作機器學習並判讀結果

商研院

人工智慧-Python與資料科學

這是一門有別於坊間的AI數位課程，不僅有清楚的觀念說明也有詳細的程式解說。教你Python程式並瞭解如何實際進行資料處理。本課程以「程式打底」為目標，教授Python語言及以Numpy、Pandas、Matplotlib進行資料處理與分析。學習目標【Python與資料科學】 1. 能快速熟悉Python語言的核心與Python常用的資料結構 2. 學會運用資料科學常用套件-Numpy、pandas、matplotlib來處理、分析與圖表化資料 3. 機器學習的設計方法與術語-從迴歸(Regression)方程式認識機器學習的基本精神 4. 能不使用任何工具套件，以Python實作迴歸方程式 ※ 課程適用經濟部iPAS巨量資料分析師/機器學習工程師能力鑑定考試準備章節架構 ►Python 簡介 ►變數與動態資料型別 ►運算式 ►序列資料結構- list, tuple, range ►流程控制 ►更多資料結構-set, frozenset, dict, byte, bytearray ►函數 ►變數命名空間 ►類別設計 ►例外處理 ►模組與套件 ►輸入輸出與檔案處理(txt,csv,JSON, pickle) ► 其他(https urlib、beautifulshop,…) ► 附錄: Anaconda Windows/Linux安裝與使用 ►conda 套件管理 ►conda 虛擬環境 ►ipython interpreter ►jupyter notebook ►資料矩陣運算使用Numpy ►資料匯入匯出使用Pandas ►繪圖與製表使用Matplotlib ►機器學習概念 ►最佳化演算法: Gradient Descent ►手刻Gradient Descent演算法 ►手刻線性迴歸 ►手刻線性迴歸作(矩陣版)

艾鍗學院

R語言/R-Studio入門─統計分析、資料探勘與機器學習的原理與實戰演練

R語言是開源的統計程式語言，常用於開發統計、資料分析軟體系統，課程中我們將從R/R-Studio入門，從統計分析、資料探勘與機器學習的原理與技巧，讓學員有能力進行相關的資料分析技術與資料視覺化整合應用。本門課適合想瞭解R語言，作為進入大數據分析基礎，或進行量化研究、進階資料視覺化。

緯育TibaMe

iPAS機器學習工程師考照班

AI即未來！各大產業離不開機器學習，人工智慧如火如荼發展，整個產業勢必向智慧化靠攏， AI人才需求也倍數增長！iPAS產業人才能力鑑定是經濟部為充裕產業升級所需人才，整合產官學研所建立的鑑定體制。有專業能力認證，更容易獲得企業優先面試/聘用及加薪之機會。艾鍗學院授課講師皆取得iPAS認證，章章精彩、片刻不冷場，帶給學員最實戰的應試指南，打穩機器學習工程師的基本功！學習目標 1. 帶你了解機器學習產業發展趨勢及應用方向 2. 養成資料特徵與資料預處理能力，並能運用探索式資料分析(EDA)，洞悉數據關聯性。 3. 教你機器學習和深度學習的專業術語與觀念，並能了解其背後的意義及數學意義。 4. 漸進式熟悉機器學習演算法與模型建立流程，後續模型訓練成效之驗證。 5. 從提供之iPAS樣題詳細解析中，了解更多觀念與實作技巧章節架構初級 Part 1. 機器學習觀念打底 Section A：資料處理分析與特徵選擇 1. 人工智慧與機器學習簡介 2. 機器學習如何進行學習 3. 資料與特徵 4. 機器學習建立模型的流程 5. 探索式資料分析(EDA)與資料預處理方法 6. 如何挑選好的特徵? Feature Selection v.s. Feature Extraction Section B：監督式機器學習演算法 1. 迴歸模型: 線性迴歸▼ iPAS ML linear regression Ridge v.s. Lasso 線性迴歸評估迴歸模型的性能指標 2. 分類模型: Logistic Regression 演算法 KNN 演算法決策樹演算法 SVM 演算法與數學原理評估分類模型的性能指標 3. Ensemble Method Random Forest隨機森林 Adaboost Section C：非監督式機器學習演算法 1. 降維: PCA 演算法▼ iPAS ML The Algorithm of PCA c 2. Clustering: K-means 演算法 Hierarchical Method 演算法 3. 強化學習強化學習的架構 Q-learning 演算法 Section D：深度學習 1. 深度學習技術簡介 2. 類神經網路運算模型原理 3. 深度學習建立模型的流程 4. 深度學習框架TensorFlow/Keras 程式架構說明 5. 其他網路結構簡介：RNN/LSTM、CNN Part 2. Python實作機器學習 1. 資料處理工具: Numpy、Pandas▼ iPAS ML Pandas 2. 視覺化工具: Matplotlib▼ iPAS ML Matplotlib c 3. 機器學習工具:Scikit-learn 4. 迴歸模型實作 y=f(x) 的函式預測價格預測模型 5. 鳶尾花花卉分類與探討▼ iPAS ML iris 使用Logistic Regression 使用KNN 使用Decision Tree▼ iPAS ML Decision Tree 使用SVM▼ iPAS ML SVM 使用Random Forest 使用Adaboost 6.PCA 降維使用Scikit-learn▼ iPAS ML PCA降維使用Scikit learn 7.K-means分群使用Scikit-learn▼ K means分群使用Scikit 8.Hierarchical方法分群使用Scikit-learn▼ iPAS ML Hierarchical Scikit learn 9.強化學習-找寶藏地圖實作解析▼ iPAS ML Reinforcement learning iPAS ML Q learning value function Part 3. iPAS機器學習工程師範例試題詳解

艾鍗學院

資料探勘一步到位: 原理與分類/聚類演算

學習這門資料探勘課程，資料挖得快又精準！課程將讓你從資料探勘原理到關聯規則的觀念與使用技巧、分類原理的觀念、分類方法、決策樹、簡單貝式分類、聚類原理的觀念、K-Means、階層聚類技術、DBSCAN密度式聚類法。

緯育TibaMe

學習精靈

12/03 00:00

youtube.com

【資料科學課程】資料探勘 Day 1

48 0

分享到：

Line

Facebook

複製連結

取消

推薦證照

Google專業資料工程師認證、

TQC+ SD-網頁資料擷取與分析

Mike的Python學院

關注

Mike Ku

Learn Code With Mike品牌創辦人

2021/11/24

4個必學的Pandas套件處理遺漏值資料方法

本文以Kaggle網站的「Netflix data with IMDB scores added( https://www.kaggle.com/sarahjeeeze/imdbfile )」資料集為例，來和大家分享筆者在處理遺漏值(Missing Value)時，常用的Pandas套件方法(Method)。

Q:Pandas如何探索遺漏值(Missing Value)?

如果想要探索每一個欄位資料是否有遺漏值(Missing Value)，通常會使用Pandas套件的isnull()方法(Method)來查看，如下範例：