104學習

資料探勘

AI 專區學習課程

證照測驗共學新知

資料探勘

關注

邀請朋友

邀請朋友

Line

Facebook

複製連結

取消

資料探勘是從大量資料中找出有價值的模式、趨勢或關聯，幫助企業做出更明智的決策。具備這項技能的人能運用統計、機器學習和資料分析方法，提升業務效率、預測市場變化或優化客戶體驗。在數位轉型及大數據時代，這項能力極具競爭力，廣泛應用於行銷、金融、製造、醫療等領域，對職涯發展有很大幫助。

關於教室

關注人數 12 人

104人力銀行從職缺中挑選出常見技能所成立的官方教室，提供大家進行共學互動。

學習主持人

持續分享知識，
有機會成為官方教室主持人

教室標籤

Hi~ 歡迎分享學習資源，有學習問題可匿名向Giver發問！

我要分享

我要提問

資料探勘學習推薦

每日推薦一堂課

關注

一零四線上嚴選

小編

2022/10/08

[AI關鍵技能：資料探勘] 一步到位_原理、分類及聚類演算

這兩週連續介紹兩個AI關鍵技術，本週是另一個關鍵技術「資料探勘」；

這兩週所分享的機器學習與資料探勘，可以做到的不只是 AlphaGO 所能做到的與人類下棋，更可以擴大應用範圍至網路電商的商品推薦、製造業的自動化製造流程等，所以會被視為關鍵技術。

本週課程專門針對「資料探勘」來分享；本課程我們可以獲得以下知識技能：資料探勘的原理、關聯規則原理與實務、分類原理、聚類原理、平均聚類演算法、階層聚類技術、DBSCAN密度式聚類法等。

那需要如何依序學習呢？課程將分為三大部分進行教學，分別為：資料探勘概論及關聯規則、分類概念與技術、聚類概念與技術。

第一部分資料探勘部分，老師從學習方法開始分享，讓我們往後接觸時，可以快速掌握；接下來就會定義資料探勘的意義，以了解其重要性。之後，將會帶我們知道目前主要技術有哪些、各自在哪些地方應用、業界常用的專業用語；，在第一部份下半段，會開始學習Apriori 及 FP-Growth 兩種演算法；透過兩種演算法所獲得的資料支持度與信賴度該如何看。

第二部分及第三部份分別要學分類與聚類概念；將會以演算法帶大家了解分類與聚類演算法；除了演算法的部分是必要的技術外，還會學習如何衡量分類模型準確性、決策樹、屬性選擇指標、屬性分割等。

這門課程希望參與的學員能夠一次帶領大家學會資料探勘所有觀念及技術。

推薦課程網址：

https://www.tibame.com/course/49

祝您工作順利、學習愉快

104學習精靈小編陪您每日學習成長1%

看更多

[AI關鍵技能：資料探勘] 一步到位_原理、分類及聚類演算

0 0 626 0

拍手

留言

分享到：

Line

Facebook

複製連結

取消

收藏

Mike的Python學院

關注

Mike Ku

Learn Code With Mike品牌創辦人

2021/11/24

4個必學的Pandas套件處理遺漏值資料方法

本文以Kaggle網站的「Netflix data with IMDB scores added( https://www.kaggle.com/sarahjeeeze/imdbfile )」資料集為例，來和大家分享筆者在處理遺漏值(Missing Value)時，常用的Pandas套件方法(Method)。

Q:Pandas如何探索遺漏值(Missing Value)?

如果想要探索每一個欄位資料是否有遺漏值(Missing Value)，通常會使用Pandas套件的isnull()方法(Method)來查看，如下範例：

df = pd.read_csv('mycsvfile.csv')

print(df.isnull())

Pandas套件的isnull()方法(Method)會將所有欄位資料內容顯示為布林值(Boolean)，只要是遺漏值(Missing Value)就會顯示為True。

但是這樣並沒有辦法讓我們快速瞭解每個欄位的遺漏值(Missing Value)狀況，這時候就可以搭配使用Pandas套件的sum()方法(Method)，將每個欄位進行加總，瞭解每個欄位的遺漏值(Missing Value)個數，如下範例：

df = pd.read_csv('mycsvfile.csv')

print(df.isnull().sum())

由於在Python中，True代表1，False代表0，所以利用Pandas套件的isnull()與sum()方法(Method)，就能夠知道資料集的每個欄位遺漏值(Missing Value)個數。

Q:Pandas如何檢視遺漏值(Missing Value)?

探索了每個欄位的遺漏值(Missing Value)個數後，如果想要特別檢視特定欄位的遺漏值(Missing Value)資料內容，就可以利用以下的Pandas套件篩選語法：

df = pd.read_csv('mycsvfile.csv')

print(df[df.date_added.isnull()])

以上範例，就是檢視date_added(新增日期)欄位的11筆遺漏值(Missing Value)資料內容。

Q:Pandas dropna()方法(Method)如何使用?

Pandas套件提供了dropna()方法(Method)來因應不同的需求，包含：

1.dropna(how='any')：任一欄位有遺漏值(Missing Value)的資料就移除，如下範例：

df = pd.read_csv('mycsvfile.csv')

print(df.dropna(how='any'))

2.dropna(how='all')：所有欄位皆有遺漏值(Missing Value)的資料就移除，如下範例：

df = pd.read_csv('mycsvfile.csv')

print(df.dropna(how='all'))

3.dropna(subset=['欄位名稱', ...], how='any')：任一個指定的欄位有遺漏值(Missing Value)的資料就移除，如下範例：

df = pd.read_csv('mycsvfile.csv')

print(df.dropna(subset=['director', 'date_added'], how='any'))

4.dropna(subset=['欄位名稱', ...], how='all')：指定的欄位皆有遺漏值(Missing Value)的資料就移除，如下範例：

df = pd.read_csv('mycsvfile.csv')

print(df.dropna(subset=['director', 'date_added'], how='all'))

Q:Pandas fillna()方法(Method)如何使用?

另一個遺漏值(Missing Value)資料的處理方式，就是填入自訂的值，這時候就能利用Pandas套件的fillna()方法(Method)，指定value關鍵字參數(Keyword Argument)為想要填入的值即可，如下範例：

df = pd.read_csv('mycsvfile.csv')

df['director'].fillna(value='Not Found', inplace=True)

如果想要學習更多的Python應用教學，歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/07/pandas-handle-missing-value.html )網站觀看更多精彩內容。

看更多

4個必學的Pandas套件處理遺漏值資料方法

learncodewithmike.com

[Pandas教學]4個必學的Pandas套件處理遺漏值(Missing Value)資料方法

2 0 279 2

拍手

留言

分享到：

Line

Facebook

複製連結

取消

收藏

104學習精選課程

看更多課程

想提升職場競爭力？專業技能課程看起來👇

AI資料分析資料科學家必學！MySQL資料庫從零到高手：全面實作指南與應用案例

課程單元列表： 01-教學大綱與資料庫介紹 02-MySQL資料庫安裝 03-MySQL資料庫管理 04-資料庫、資料表設計與建立 05-新增單筆與整批匯入資料 06-基礎操作-查詢、更新與刪除資料 07-進階操作-資料排序 08-進階操作-資料分組 09-進階操作-二個資料表查詢 10-進階操作-空資料的處理 11-進階操作-找出重覆資料 12-進階操作-防止重覆資料 13-常用函數介紹與字串函數實作 14-數字函數實作 15-日期函數實作 16-運算符號介紹及算術運算實作 17-運算符號-邏輯運算實作 18-運算符號-比較運算實作 19-如何匯出資料 20-從SQL小白到數據高手：用ChatGPT輕鬆超越傳統IT專家

龍耀智能企業社

超越基礎：用10個高效指令成為Python進階用戶

課程清單： 00-課程介紹與大綱 01-python初學者與進階使用者的區別 02-10個關鍵python指令函式模塊介紹 03-第1招：print 函數 04-第2招：list 數據結構 05-第3招：if-elif-else 條件語句 06-第4招：for 和 while 迴圈 07-第5招：dict 字典 08-第6招：def 自定義函數 09-第7招：lambda 匿名函數 10-第8招：import 模塊和包 11-第9招：try-except 錯誤處理 12-第10招：pandas 數據處理 13-回顧與小結

龍耀智能企業社

R語言/R-Studio入門─統計分析、資料探勘與機器學習的原理與實戰演練

R語言是開源的統計程式語言，常用於開發統計、資料分析軟體系統，課程中我們將從R/R-Studio入門，從統計分析、資料探勘與機器學習的原理與技巧，讓學員有能力進行相關的資料分析技術與資料視覺化整合應用。本門課適合想瞭解R語言，作為進入大數據分析基礎，或進行量化研究、進階資料視覺化。

成為 AI 科學家｜資料探勘速成攻略，輕鬆駕馭資料分析與實務應用

這門課程帶你從數據輸入開始，學習對資料的清洗。清洗儲存完成後，就可以開始著手分析，將分析結果以清晰易懂的圖表或圖形在螢幕或報表上展示。分析方面，還會學到商場上最熱門的關聯性分析，並在 Numpy，Pandas，MatplotLib 等程式庫實作後，學到基本的迴歸預測，資料分類以及分群的原理與技巧。

資料探勘一步到位: 原理與分類/聚類演算

學習這門資料探勘課程，資料挖得快又精準！課程將讓你從資料探勘原理到關聯規則的觀念與使用技巧、分類原理的觀念、分類方法、決策樹、簡單貝式分類、聚類原理的觀念、K-Means、階層聚類技術、DBSCAN密度式聚類法。

人工智慧-資料科學｜本課程為線上課

教你使用Numpy、Pandas、Matplotlib如何進行資料處理與分析

推薦證照

Google專業資料工程師認證、

TQC+ SD-網頁資料擷取與分析

你可能感興趣的教室