104學習精靈

資料探勘

資料探勘
關注
邀請朋友
邀請朋友

Line

Facebook

複製連結

取消
關於教室
關注人數 5 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
關於教室
關注人數 5 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
Hi~ 歡迎分享學習資源,有學習問題可匿名向Giver發問!
我要分享
我要提問

資料探勘 學習推薦

全部
影片
文章
一零四線上嚴選

小編

2022/10/08

[AI關鍵技能:資料探勘] 一步到位_原理、分類及聚類演算
這兩週連續介紹兩個AI關鍵技術,本週是另一個關鍵技術「資料探勘」;
這兩週所分享的機器學習與資料探勘,可以做到的不只是 AlphaGO 所能做到的與人類下棋,更可以擴大應用範圍至網路電商的商品推薦、製造業的自動化製造流程等,所以會被視為關鍵技術。
本週課程專門針對「資料探勘」來分享;本課程我們可以獲得以下知識技能:資料探勘的原理、關聯規則原理與實務、分類原理、聚類原理、平均聚類演算法、階層聚類技術、DBSCAN密度式聚類法等。
那需要如何依序學習呢? 課程將分為三大部分進行教學,分別為:資料探勘概論及關聯規則、分類概念與技術、聚類概念與技術。
第一部分資料探勘部分,老師從學習方法開始分享,讓我們往後接觸時,可以快速掌握;接下來就會定義資料探勘的意義,以了解其重要性。之後,將會帶我們知道目前主要技術有哪些、各自在哪些地方應用、業界常用的專業用語;,在第一部份下半段,會開始學習Apriori 及 FP-Growth 兩種演算法;透過兩種演算法所獲得的資料支持度與信賴度該如何看。
第二部分及第三部份分別要學分類與聚類概念;將會以演算法帶大家了解分類與聚類演算法;除了演算法的部分是必要的技術外,還會學習如何衡量分類模型準確性、決策樹、屬性選擇指標、屬性分割等。
這門課程希望參與的學員能夠一次帶領大家學會資料探勘所有觀念及技術。
推薦課程網址:
祝您 工作順利、學習愉快
104學習精靈小編 陪您每日學習成長1%
0 0 377 0

熱門精選

陳立婕

產品行銷專案經理

04/18 12:31

🔥104人力銀行「2024職涯博覽會」開始報名啦📢
一年就這一次!應屆預備找工作搶先報名 👉 https://tw104.pse.is/5u86r4
微軟、緯穎、德州儀器、遊戲橘子、東京威力科創、KPMG、IKEA、星巴克、宜得利、迪卡儂等,上百家頂尖知名企業現場徵才🤩
📍 6/15(六) 資訊科技、顧問金融業
企業名單看這邊➡️ https://tw104.pse.is/5u834l
📍 6/16(日) 電子製造業、零售服務業
企業名單看這邊➡️ https://tw104.pse.is/5u83bn
連續兩日,優質企業將在現場釋出數千個工作機會💼
另有中高階獵才、職涯諮詢、趨勢論壇、夜fun職場等系列活動,
主題精采多元,除部分講座收費,其餘活動皆 免費!免費!免費!
心動不如立即搶先報名👉 https://tw104.pse.is/5u86r4
1 2 3045 0
104學習精靈精選課程
看更多課程
想提升職場競爭力?專業技能課程看起來👇
人工智慧-Python與資料科學
這是一門有別於坊間的AI數位課程,不僅有清楚的觀念說明也有詳細的程式解說。教你Python程式並瞭解如何實際進行資料處理。 本課程以「程式打底」為目標,教授Python語言及以Numpy、Pandas、Matplotlib進行資料處理與分析。 學習目標 【Python與資料科學】 1. 能快速熟悉Python語言的核心與Python常用的資料結構 2. 學會運用資料科學常用套件-Numpy、pandas、matplotlib來處理、分析與圖表化資料 3. 機器學習的設計方法與術語-從迴歸(Regression)方程式認識機器學習的基本精神 4. 能不使用任何工具套件,以Python實作迴歸方程式 ※ 課程適用經濟部iPAS巨量資料分析師/機器學習工程師能力鑑定考試準備 章節架構 ►Python 簡介 ►變數與動態資料型別 ►運算式 ►序列資料結構- list, tuple, range ►流程控制 ►更多資料結構-set, frozenset, dict, byte, bytearray ►函數 ►變數命名空間 ►類別設計 ►例外處理 ►模組與套件 ►輸入輸出與檔案處理(txt,csv,JSON, pickle) ► 其他(https urlib、beautifulshop,…) ► 附錄: Anaconda Windows/Linux安裝與使用 ►conda 套件管理 ►conda 虛擬環境 ►ipython interpreter ►jupyter notebook ►資料矩陣運算使用Numpy ►資料匯入匯出使用Pandas ►繪圖與製表使用Matplotlib ►機器學習概念 ►最佳化演算法: Gradient Descent ►手刻Gradient Descent演算法 ►手刻線性迴歸 ►手刻線性迴歸作(矩陣版)
艾鍗學院
人工智慧-Python與資料科學
這是一門有別於坊間的AI數位課程,不僅有清楚的觀念說明也有詳細的程式解說。教你Python程式並瞭解如何實際進行資料處理。 本課程以「程式打底」為目標,教授Python語言及以Numpy、Pandas、Matplotlib進行資料處理與分析。 學習目標 【Python與資料科學】 1. 能快速熟悉Python語言的核心與Python常用的資料結構 2. 學會運用資料科學常用套件-Numpy、pandas、matplotlib來處理、分析與圖表化資料 3. 機器學習的設計方法與術語-從迴歸(Regression)方程式認識機器學習的基本精神 4. 能不使用任何工具套件,以Python實作迴歸方程式 ※ 課程適用經濟部iPAS巨量資料分析師/機器學習工程師能力鑑定考試準備 章節架構 ►Python 簡介 ►變數與動態資料型別 ►運算式 ►序列資料結構- list, tuple, range ►流程控制 ►更多資料結構-set, frozenset, dict, byte, bytearray ►函數 ►變數命名空間 ►類別設計 ►例外處理 ►模組與套件 ►輸入輸出與檔案處理(txt,csv,JSON, pickle) ► 其他(https urlib、beautifulshop,…) ► 附錄: Anaconda Windows/Linux安裝與使用 ►conda 套件管理 ►conda 虛擬環境 ►ipython interpreter ►jupyter notebook ►資料矩陣運算使用Numpy ►資料匯入匯出使用Pandas ►繪圖與製表使用Matplotlib ►機器學習概念 ►最佳化演算法: Gradient Descent ►手刻Gradient Descent演算法 ►手刻線性迴歸 ►手刻線性迴歸作(矩陣版)
艾鍗學院
iPAS機器學習工程師考照班
AI即未來!各大產業離不開機器學習,人工智慧如火如荼發展,整個產業勢必向智慧化靠攏, AI人才需求也倍數增長!iPAS產業人才能力鑑定是經濟部為充裕產業升級所需人才, 整合產官學研所建立的鑑定體制。有專業能力認證,更容易獲得企業優先面試/聘用及加薪之機會。艾鍗學院授課講師皆取得iPAS認證,章章精彩、片刻不冷場,帶給學員最實戰的應試指南,打穩機器學習工程師的基本功! 學習目標 1. 帶你了解機器學習產業發展趨勢及應用方向 2. 養成資料特徵與資料預處理能力,並能運用探索式資料分析(EDA),洞悉數據關聯性。 3. 教你機器學習和深度學習的專業術語與觀念,並能了解其背後的意義及數學意義。 4. 漸進式熟悉機器學習演算法與模型建立流程,後續模型訓練成效之驗證。 5. 從提供之iPAS樣題詳細解析中,了解更多觀念與實作技巧 章節架構 初級 Part 1. 機器學習觀念打底 Section A:資料處理分析與特徵選擇 1. 人工智慧與機器學習簡介 2. 機器學習如何進行學習 3. 資料與特徵 4. 機器學習建立模型的流程 5. 探索式資料分析(EDA)與資料預處理方法 6. 如何挑選好的特徵? Feature Selection v.s. Feature Extraction Section B:監督式機器學習演算法 1. 迴歸模型: 線性迴歸▼ iPAS ML linear regression Ridge v.s. Lasso 線性迴歸 評估迴歸模型的性能指標 2. 分類模型: Logistic Regression 演算法 KNN 演算法 決策樹演算法 SVM 演算法與數學原理 評估分類模型的性能指標 3. Ensemble Method Random Forest隨機森林 Adaboost Section C:非監督式機器學習演算法 1. 降維: PCA 演算法▼ iPAS ML The Algorithm of PCA c 2. Clustering: K-means 演算法 Hierarchical Method 演算法 3. 強化學習 強化學習的架構 Q-learning 演算法 Section D:深度學習 1. 深度學習技術簡介 2. 類神經網路運算模型原理 3. 深度學習建立模型的流程 4. 深度學習框架TensorFlow/Keras 程式架構說明 5. 其他網路結構簡介:RNN/LSTM、CNN Part 2. Python實作機器學習 1. 資料處理工具: Numpy、Pandas▼ iPAS ML Pandas 2. 視覺化工具: Matplotlib▼ iPAS ML Matplotlib c 3. 機器學習工具:Scikit-learn 4. 迴歸模型實作 y=f(x) 的函式預測 價格預測模型 5. 鳶尾花花卉分類與探討▼ iPAS ML iris 使用Logistic Regression 使用KNN 使用Decision Tree▼ iPAS ML Decision Tree 使用SVM▼ iPAS ML SVM 使用Random Forest 使用Adaboost 6.PCA 降維使用Scikit-learn▼ iPAS ML PCA降維使用Scikit learn 7.K-means分群使用Scikit-learn▼ K means分群使用Scikit 8.Hierarchical方法分群使用Scikit-learn▼ iPAS ML Hierarchical Scikit learn 9.強化學習-找寶藏地圖實作解析▼ iPAS ML Reinforcement learning iPAS ML Q learning value function Part 3. iPAS機器學習工程師範例試題詳解
艾鍗學院
學習精靈

12/03 00:00

48 0
Mike Ku

Learn Code With Mike品牌創辦人

2021/11/24

4個必學的Pandas套件處理遺漏值資料方法
本文以Kaggle網站的「Netflix data with IMDB scores added( https://www.kaggle.com/sarahjeeeze/imdbfile )」資料集為例,來和大家分享筆者在處理遺漏值(Missing Value)時,常用的Pandas套件方法(Method)。
Q:Pandas如何探索遺漏值(Missing Value)?
如果想要探索每一個欄位資料是否有遺漏值(Missing Value),通常會使用Pandas套件的isnull()方法(Method)來查看,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.isnull())
Pandas套件的isnull()方法(Method)會將所有欄位資料內容顯示為布林值(Boolean),只要是遺漏值(Missing Value)就會顯示為True。
但是這樣並沒有辦法讓我們快速瞭解每個欄位的遺漏值(Missing Value)狀況,這時候就可以搭配使用Pandas套件的sum()方法(Method),將每個欄位進行加總,瞭解每個欄位的遺漏值(Missing Value)個數,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.isnull().sum())
由於在Python中,True代表1,False代表0,所以利用Pandas套件的isnull()與sum()方法(Method),就能夠知道資料集的每個欄位遺漏值(Missing Value)個數。
Q:Pandas如何檢視遺漏值(Missing Value)?
探索了每個欄位的遺漏值(Missing Value)個數後,如果想要特別檢視特定欄位的遺漏值(Missing Value)資料內容,就可以利用以下的Pandas套件篩選語法:
df = pd.read_csv('mycsvfile.csv')
print(df[df.date_added.isnull()])
以上範例,就是檢視date_added(新增日期)欄位的11筆遺漏值(Missing Value)資料內容。
Q:Pandas dropna()方法(Method)如何使用?
Pandas套件提供了dropna()方法(Method)來因應不同的需求,包含:
1.dropna(how='any'):任一欄位有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(how='any'))
2.dropna(how='all'):所有欄位皆有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(how='all'))
3.dropna(subset=['欄位名稱', ...], how='any'):任一個指定的欄位有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(subset=['director', 'date_added'], how='any'))
4.dropna(subset=['欄位名稱', ...], how='all'):指定的欄位皆有遺漏值(Missing Value)的資料就移除,如下範例:
df = pd.read_csv('mycsvfile.csv')
print(df.dropna(subset=['director', 'date_added'], how='all'))
Q:Pandas fillna()方法(Method)如何使用?
另一個遺漏值(Missing Value)資料的處理方式,就是填入自訂的值,這時候就能利用Pandas套件的fillna()方法(Method),指定value關鍵字參數(Keyword Argument)為想要填入的值即可,如下範例:
df = pd.read_csv('mycsvfile.csv')
df['director'].fillna(value='Not Found', inplace=True)
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/07/pandas-handle-missing-value.html )網站觀看更多精彩內容。
2 0 105 2
學習精靈

05/22 00:00

248 12

推薦給你

104學習精靈

產品

11小時前

10個適合用在句首的單字,簡單好記,又有變化!附上例句說明
1. Totally (完全地):
Totally, I agree with your point of view.
2. Absolutely (絕對):
Absolutely, we should go with that option.
3. Definitely (肯定地):
Definitely, let's schedule a meeting for tomorrow.
4. Certainly (當然):
Certainly, I can help you with that task.
5. Surely (無疑地):
Surely, you can count on me for support.
6. Indeed (的確):
Indeed, it was a challenging project.
7. Absolutely (絕對):
Absolutely, we should proceed with caution.
8. Certainly (當然):
Certainly, that's a valid point you raised.
9. Definitely (肯定地):
Definitely, I'll look into it right away.
10. Absolutely (絕對):
Absolutely, let's aim for excellence in our work.
1 0 377 0
你可能感興趣的教室