104學習

資料探勘

資料探勘
關注
邀請朋友
邀請朋友

Line

Facebook

複製連結

取消
「資料探勘:負責從大量數據中發掘有價值的資訊,以支持業務決策並提升經營效益。主要責任包括制定數據分析策略、使用各種數據探勘技術(如機器學習、統計分析)來識別趨勢與模式,以及撰寫報告以清楚呈現結果。要求具備強大的數據處理能力與編程技能(如Python、R),並熟悉資料庫管理(如SQL)。此外,需具備良好的跨部門協作與溝通技巧,以便有效解釋分析結果並推動改善措施,特別是在快速變動的台灣市場環境中,應對資料完整性與準確性挑戰。」
關於教室
關注人數 12 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
關於教室
關注人數 12 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
Hi~ 歡迎分享學習資源,有學習問題可匿名向Giver發問!
我要分享
我要提問

資料探勘 學習推薦

一零四線上嚴選

小編

2022/10/08

[AI關鍵技能:資料探勘] 一步到位_原理、分類及聚類演算
這兩週連續介紹兩個AI關鍵技術,本週是另一個關鍵技術「資料探勘」;
這兩週所分享的機器學習與資料探勘,可以做到的不只是 AlphaGO 所能做到的與人類下棋,更可以擴大應用範圍至網路電商的商品推薦、製造業的自動化製造流程等,所以會被視為關鍵技術。
本週課程專門針對「資料探勘」來分享;本課程我們可以獲得以下知識技能:資料探勘的原理、關聯規則原理與實務、分類原理、聚類原理、平均聚類演算法、階層聚類技術、DBSCAN密度式聚類法等。
那需要如何依序學習呢? 課程將分為三大部分進行教學,分別為:資料探勘概論及關聯規則、分類概念與技術、聚類概念與技術。
第一部分資料探勘部分,老師從學習方法開始分享,讓我們往後接觸時,可以快速掌握;接下來就會定義資料探勘的意義,以了解其重要性。之後,將會帶我們知道目前主要技術有哪些、各自在哪些地方應用、業界常用的專業用語;,在第一部份下半段,會開始學習Apriori 及 FP-Growth 兩種演算法;透過兩種演算法所獲得的資料支持度與信賴度該如何看。
第二部分及第三部份分別要學分類與聚類概念;將會以演算法帶大家了解分類與聚類演算法;除了演算法的部分是必要的技術外,還會學習如何衡量分類模型準確性、決策樹、屬性選擇指標、屬性分割等。
這門課程希望參與的學員能夠一次帶領大家學會資料探勘所有觀念及技術。
推薦課程網址:
祝您 工作順利、學習愉快
104學習精靈小編 陪您每日學習成長1%
看更多
0 0 597 0
Mike Ku

Learn Code With Mike品牌創辦人

2021/11/24

4個必學的Pandas套件處理遺漏值資料方法
本文以Kaggle網站的「Netflix data with IMDB scores added( https://www.kaggle.com/sarahjeeeze/imdbfile )」資料集為例,來和大家分享筆者在處理遺漏值(Missing Value)時,常用的Pandas套件方法(Method)。
Q:Pandas如何探索遺漏值(Missing Value)?
如果想要探索每一個欄位資料是否有遺漏值(Missing Value),通常會使用Pandas套件的isnull()方法(Method)來查看,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.isnull())
Pandas套件的isnull()方法(Method)會將所有欄位資料內容顯示為布林值(Boolean),只要是遺漏值(Missing Value)就會顯示為True。
但是這樣並沒有辦法讓我們快速瞭解每個欄位的遺漏值(Missing Value)狀況,這時候就可以搭配使用Pandas套件的sum()方法(Method),將每個欄位進行加總,瞭解每個欄位的遺漏值(Missing Value)個數,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.isnull().sum())
由於在Python中,True代表1,False代表0,所以利用Pandas套件的isnull()與sum()方法(Method),就能夠知道資料集的每個欄位遺漏值(Missing Value)個數。
Q:Pandas如何檢視遺漏值(Missing Value)?
探索了每個欄位的遺漏值(Missing Value)個數後,如果想要特別檢視特定欄位的遺漏值(Missing Value)資料內容,就可以利用以下的Pandas套件篩選語法:
df = pd.read_csv('mycsvfile.csv')
print(df[df.date_added.isnull()])
以上範例,就是檢視date_added(新增日期)欄位的11筆遺漏值(Missing Value)資料內容。
Q:Pandas dropna()方法(Method)如何使用?
Pandas套件提供了dropna()方法(Method)來因應不同的需求,包含:
1.dropna(how='any'):任一欄位有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(how='any'))
2.dropna(how='all'):所有欄位皆有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(how='all'))
3.dropna(subset=['欄位名稱', ...], how='any'):任一個指定的欄位有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(subset=['director', 'date_added'], how='any'))
4.dropna(subset=['欄位名稱', ...], how='all'):指定的欄位皆有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(subset=['director', 'date_added'], how='all'))
Q:Pandas fillna()方法(Method)如何使用?
另一個遺漏值(Missing Value)資料的處理方式,就是填入自訂的值,這時候就能利用Pandas套件的fillna()方法(Method),指定value關鍵字參數(Keyword Argument)為想要填入的值即可,如下範例:
df = pd.read_csv('mycsvfile.csv')
df['director'].fillna(value='Not Found', inplace=True)
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/07/pandas-handle-missing-value.html )網站觀看更多精彩內容。
看更多
2 0 239 2

104學習精選課程

看更多課程
想提升職場競爭力?專業技能課程看起來👇

熱門精選

104學習

產品

03/26 01:07

不會寫程式,也能用AI打造高效率工作流|2週完成你的第一個自動化專案
【超早鳥優惠到4/6】🔥領53折券現折🔥
【獨家-名額倒數】前20名報名再贈200元LIN點數
【2 天假日直播學習營】第一屆 - AI行政工作流學習營​|5/17(日)、5/31(日) 假日直播課
對AI工作流充滿興趣、期待應用AI提升日常行政工作效率,卻不知如何開始?
⚡從 2週學習 × AI自動化專案實作 → 完訓取得證書⚡
🚀本屆104提供參加的學員,專屬獨家加值服務:【104完訓認證加入履歷】🚀
🚀 本次學習營獨家特色 - 循序漸進+實作應用🚀
✨真實工作場景應用:手把手學習真實工作場景如何應用AI實現自動化, 老師帶你一起來闖關!
✨完整AI專案實作:兩週循序漸進從學習、實作到應用,親手完成自己的AI工作流提案。
✨專屬學習社群共學:加入課程專屬 LINE 群組,除了能與AI工作流領域跨領域學員夥伴一同交流實戰心得,更有講師在群組中親自為你指點迷津、解答疑惑,讓學習從教室延伸到工作現場。
【保握超早鳥優惠】
看更多
0 0 4615 0
你可能感興趣的教室