104學習

資料探勘

資料探勘
關注
邀請朋友
邀請朋友

Line

Facebook

複製連結

取消
資料探勘是從大量資料中找出有價值的模式、趨勢或關聯,幫助企業做出更明智的決策。具備這項技能的人能運用統計、機器學習和資料分析方法,提升業務效率、預測市場變化或優化客戶體驗。在數位轉型及大數據時代,這項能力極具競爭力,廣泛應用於行銷、金融、製造、醫療等領域,對職涯發展有很大幫助。
關於教室
關注人數 12 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
關於教室
關注人數 12 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
Hi~ 歡迎分享學習資源,有學習問題可匿名向Giver發問!
我要分享
我要提問

資料探勘 學習推薦

一零四線上嚴選

小編

2022/10/08

[AI關鍵技能:資料探勘] 一步到位_原理、分類及聚類演算
這兩週連續介紹兩個AI關鍵技術,本週是另一個關鍵技術「資料探勘」;
這兩週所分享的機器學習與資料探勘,可以做到的不只是 AlphaGO 所能做到的與人類下棋,更可以擴大應用範圍至網路電商的商品推薦、製造業的自動化製造流程等,所以會被視為關鍵技術。
本週課程專門針對「資料探勘」來分享;本課程我們可以獲得以下知識技能:資料探勘的原理、關聯規則原理與實務、分類原理、聚類原理、平均聚類演算法、階層聚類技術、DBSCAN密度式聚類法等。
那需要如何依序學習呢? 課程將分為三大部分進行教學,分別為:資料探勘概論及關聯規則、分類概念與技術、聚類概念與技術。
第一部分資料探勘部分,老師從學習方法開始分享,讓我們往後接觸時,可以快速掌握;接下來就會定義資料探勘的意義,以了解其重要性。之後,將會帶我們知道目前主要技術有哪些、各自在哪些地方應用、業界常用的專業用語;,在第一部份下半段,會開始學習Apriori 及 FP-Growth 兩種演算法;透過兩種演算法所獲得的資料支持度與信賴度該如何看。
第二部分及第三部份分別要學分類與聚類概念;將會以演算法帶大家了解分類與聚類演算法;除了演算法的部分是必要的技術外,還會學習如何衡量分類模型準確性、決策樹、屬性選擇指標、屬性分割等。
這門課程希望參與的學員能夠一次帶領大家學會資料探勘所有觀念及技術。
推薦課程網址:
祝您 工作順利、學習愉快
104學習精靈小編 陪您每日學習成長1%
看更多
0 0 605 0
Mike Ku

Learn Code With Mike品牌創辦人

2021/11/24

4個必學的Pandas套件處理遺漏值資料方法
本文以Kaggle網站的「Netflix data with IMDB scores added( https://www.kaggle.com/sarahjeeeze/imdbfile )」資料集為例,來和大家分享筆者在處理遺漏值(Missing Value)時,常用的Pandas套件方法(Method)。
Q:Pandas如何探索遺漏值(Missing Value)?
如果想要探索每一個欄位資料是否有遺漏值(Missing Value),通常會使用Pandas套件的isnull()方法(Method)來查看,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.isnull())
Pandas套件的isnull()方法(Method)會將所有欄位資料內容顯示為布林值(Boolean),只要是遺漏值(Missing Value)就會顯示為True。
但是這樣並沒有辦法讓我們快速瞭解每個欄位的遺漏值(Missing Value)狀況,這時候就可以搭配使用Pandas套件的sum()方法(Method),將每個欄位進行加總,瞭解每個欄位的遺漏值(Missing Value)個數,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.isnull().sum())
由於在Python中,True代表1,False代表0,所以利用Pandas套件的isnull()與sum()方法(Method),就能夠知道資料集的每個欄位遺漏值(Missing Value)個數。
Q:Pandas如何檢視遺漏值(Missing Value)?
探索了每個欄位的遺漏值(Missing Value)個數後,如果想要特別檢視特定欄位的遺漏值(Missing Value)資料內容,就可以利用以下的Pandas套件篩選語法:
df = pd.read_csv('mycsvfile.csv')
print(df[df.date_added.isnull()])
以上範例,就是檢視date_added(新增日期)欄位的11筆遺漏值(Missing Value)資料內容。
Q:Pandas dropna()方法(Method)如何使用?
Pandas套件提供了dropna()方法(Method)來因應不同的需求,包含:
1.dropna(how='any'):任一欄位有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(how='any'))
2.dropna(how='all'):所有欄位皆有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(how='all'))
3.dropna(subset=['欄位名稱', ...], how='any'):任一個指定的欄位有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(subset=['director', 'date_added'], how='any'))
4.dropna(subset=['欄位名稱', ...], how='all'):指定的欄位皆有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(subset=['director', 'date_added'], how='all'))
Q:Pandas fillna()方法(Method)如何使用?
另一個遺漏值(Missing Value)資料的處理方式,就是填入自訂的值,這時候就能利用Pandas套件的fillna()方法(Method),指定value關鍵字參數(Keyword Argument)為想要填入的值即可,如下範例:
df = pd.read_csv('mycsvfile.csv')
df['director'].fillna(value='Not Found', inplace=True)
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/07/pandas-handle-missing-value.html )網站觀看更多精彩內容。
看更多
2 0 256 2

104學習精選課程

看更多課程
想提升職場競爭力?專業技能課程看起來👇

熱門精選

職場力:提升職場競爭力

小編

04/23 17:15

ChatGPT Images 2.0上線,AI生成圖片變多強?
ChatGPT Images 2.0上線後,忍不住做一輪實測。
這次升級超有感:中文字型不會變亂碼,排版邏輯順很多,再也不是「乍看很美、細看想報警」的狀態。
試做了海報文宣、手繪塗鴉風、社群圖卡,還有不同尺寸版本,整體表現都比以往更好。
當然,AI依然不是許願池,如果有明確需求,提示詞怎麼寫還是很關鍵。尺寸、文字、風格、參考圖,精準一點都能避免大走鐘。
整理好的實測結果、提示詞5招、網路熱門手繪風提示詞詳見整理:
這組圖也是ChatGPT製作的,大家覺得如何?
看更多
1 0 1648 0
你可能感興趣的教室