104學習

資料整理

資料整理
關注
邀請朋友
邀請朋友

Line

Facebook

複製連結

取消
「資料整理:負責收集、整理與分析各類數據,以支援業務決策及報告撰寫。主要目標在於提升數據準確性與可用性,促進資料驅動的決策過程。需具備精確的數據分析能力、跨部門溝通技巧及熟悉數據管理軟體(如Excel、SQL等)。此外,因應台灣職場的合作文化,必須能有效協調各部門需求,確保資料的整合性與一致性,並具備問題解決的敏銳度,以應對快速變化的商業環境。」
關於教室
關注人數 56 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
關於教室
關注人數 56 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
Hi~ 歡迎分享學習資源,有學習問題可匿名向Giver發問!
我要分享
我要提問

資料整理 學習推薦

全部
影片
文章

不知如何開始嗎? 先進行技能挑戰吧~

技能挑戰:初級
目前等級:未達初級
980 人已通過「初級」測驗,通過率52%,和學習一起探索知識、增強能力!
我要挑戰
Lillian Huang

內容編輯

2022/09/01

Ragic 從零開始 10 分鐘教學 (8) 連結與載入
管理大量資料時,很多人常遇到的問題就是無法擺脫「複製貼上地獄」,同樣的內容常常這邊得複製貼上一份、那邊得複製貼上一份,萬一某個地方改動了,其他地方也得一一修改,不但讓工作變得累又乏味,也容易出錯。
Ragic 最基本的連結功能:「連結與載入」,就是協助大家逃離複製貼上地獄的利器!它能讓需要重複使用的資料(例如「客戶資料」、「商品資料」),利用連結與載入關係快速帶入(例如帶入「銷售訂單」),不只能節省資料登打時間、減少錯誤發生機會,也能讓資料建立有意義的關聯,方便查找與比對。
這支影片不到 10 分鐘 -- 我們要在 5 分鐘之內,說明「連結與載入」的意義,以及示範怎麼一步一步在「銷售訂單」上,建立與「客戶」資料、「商品」資料的「連結與載入」關係。
更多教學請關注「Ragic 企業雲端資料庫」YouTube 頻道
看更多
0 0 756 0

104學習精選課程

看更多課程
想提升職場競爭力?專業技能課程看起來👇
Mike Ku

Learn Code With Mike品牌創辦人

2022/01/21

3個實用的Pandas套件清理重複資料教學
本文以Kaggle網站的Amazon 2009-2019年Top50暢銷書資料集( https://www.kaggle.com/sootersaalu/amazon-top-50-bestselling-books-2009-2019 )為例,教大家如何查找及清理資料集的重複資料,提升資料的品質。
Q: Pandas duplicated()查找重複資料
想要使用Pandas套件查找資料集的重複資料,利用duplicated()方法(Method)可以得到每筆資料的重複狀態,True代表重複,False為沒重複,如下範例:
import pandas as pd
df = pd.read_csv('bestsellers with categories.csv')
print(df.duplicated())
接著,透過Pandas套件的括號[]語法即可檢視重複資料的各欄位資料,如下範例:
df = pd.read_csv('bestsellers with categories.csv')
print(df[df.duplicated()])
Pandas套件的duplicated()方法(Method)除了能夠查找所有欄位資料完全一樣的重複資料外,也提供了以下兩個關鍵字參數,來客製化查找的方式:
1. subset-查找特定欄位的重複資料
2. keep-保留第一筆(first)、最後一筆(last)或全部(False)的重複資料
如下範例:
df = pd.read_csv('bestsellers with categories.csv')
column_names = ['Name', 'Author', 'Year', 'Genre']
df = df[df.duplicated(subset=column_names, keep=False)]
print(df)
以上範例即是查找Name(書名)、Author(作者)、Year(出版年)及Genre(類型)四個欄位都一樣的重複資料,並且全部保留。
Q: Pandas drop_duplicates()刪除重複資料
從資料集裡找到重複的資料後,接下來,最常見的就是進行刪除或群組處理。
而要刪除完全一樣的重複資料,可以利用Pandas套件的drop_duplicates()方法(Method),如下範例:
df = pd.read_csv('bestsellers with categories.csv')
df.drop_duplicates(inplace=True)
其中,inplace關鍵字參數代表直接從現有資料集中刪除重複資料。
另外,要刪除特定欄位重複的資料,同樣可以透過subset及keep關鍵字參數來達成,如下範例:
df = pd.read_csv('bestsellers with categories.csv')
column_names = ['Name', 'Author', 'Year', 'Genre']
df.drop_duplicates(subset=column_names, keep='first', inplace=True)
Q: Pandas groupby()、agg()群組重複資料
除了可以利用Pandas套件的drop_duplicates()方法(Method)刪除重複資料外,有時基於商業邏輯,可以透過群組的方式解決重複資料。
這時候,就可以利用Pandas套件的groupby()方法(Method)群組相同資料的欄位,以及agg()方法(Method),統計運算剩餘的不同資料欄位,達到合併重複資料成一筆的效果,如下範例:
df = pd.read_csv('bestsellers with categories.csv')
column_names = ['Name', 'Author', 'Year', 'Genre']
summeries = {'User Rating': 'mean', 'Reviews': 'sum', 'Price': 'mean'}
df = df.groupby(by=column_names).agg(summeries).reset_index()
print(df)
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike(https://www.learncodewithmike.com/2022/01/pandas-drop-duplicate-data.html
)網站觀看更多精彩內容。
看更多
3 0 1853 0

推薦給你

104學習

產品

09/30 13:26

2025.9月證照排行榜:AWS、AI認證引領職場新趨勢
104學習近一個月用戶數據顯示,AWS雲端認證、AI人工智慧證照成為求職轉職及提升職場競爭力熱門首選。從基礎級的雲端從業人員到進階的解決方案架構師,再到新興的Gemini認證與生成式AI課程,科技類證照需求大幅領先傳統會計、多益等證照,反映企業對數位人才的迫切需求。
❇️Top1 AWS 認證的雲端從業人員-基礎級認證
通過率約為70%,此級別對於初學者友好,專門為對雲端相對陌生,且可能沒有資訊科技 (IT) 背景的考生而設計,本考試旨在幫助銷售、行銷、產品或專案管理等業務線的角色取得對 AWS 雲端的基本了解。
❇️Top2 AWS 認證的人工智慧從業人員-基礎級認證
此認證專為 AI 領域初學者設計,適合行銷、產品管理、教育等非技術職位者。考試內容包括機器學習、生成式 AI、倫理與應用場景,通過率約 65%
❇️Top3 Gemini 認證教師證書
專為教育工作者設計,證明持有人具備Gemini相關教學能力及專業,推動數位學習與課程設計。
❇️Top4 AWS 認證的解決方案架構師-助理級認證
適合具備一年以上 AWS 使用經驗者,聚焦成本與效能最佳化設計。無需程式實作背景,是雲端架構職涯的重要跳板。
❇️Top5 生成式AI課程認證
目標是讓學習者掌握生成式AI的基礎概念、實際應用及工具操作能力。內容包括大型語言模型(LLM)、生成式AI如何提升工作效率,以及Google Cloud的相關技術應用。
❇️Top6 公共工程品質管理人員 ↗️面試邀約提升:約 3倍
凡參與公共工程,需擔任品管人員(如施工、監造、管理等工程從業人員),都必須參加由工程會或其委託訓練機構舉辦的公共工程品質管理訓練課程,並取得結業證書。
❇️Top7 丙級會計事務技術士 ↗️面試邀約提升:1.4倍
▶️【點我免費做模擬測驗】
中小企業與事務所普遍需求的財會基礎證照,內容包含帳務處理、報表編製與基本稅務實務。適合準備從事會計助理、出納、財務行政等工作的求職者。根據2023年(民國112年)勞動部資料,該證照通過率為52.6%。
❇️Top8 AWS認證的開發人員-助理級認證
適合具備一年以上程式開發經驗者,考核使用 AWS 服務進行應用程式開發與部署能力,是雲端工程師與後端開發者提升職場競爭力的重要認證。
❇️Top9 TOEIC (多益測驗)
▶️【點我免費做模擬測驗】https://nabi.104.com.tw/assess/toeic/
多益成績已成為企業判斷求職者英語能力的標準,特別是外商公司。建議考取750分以上,若能獲得金色證書(860分以上),更能在職場競爭中脫穎而出。尤其對有志於外商企業、跨國集團或海外派駐的人才而言,TOEIC成績更是履歷的重要加分項。
❇️Top10 丙級電腦軟體應用技術士
行政助理、文書處理等職位的重要加分證照,通過率近六成。報考資格:年滿15歲或國民中學畢業即可報考。
想查熱門證照、掌握報名資訊與考古題?立即造訪【104證照中心】https://nabi.104.com.tw/certify
看更多
0 0 2141 2
你可能感興趣的教室