104學習精靈

資料整合

資料整合
關注
邀請朋友
邀請朋友

Line

Facebook

複製連結

取消
「資料整合:負責收集、整理及分析各類數據,以提昇決策效率與業務成效。此角色的主要目標為促進資料的有效整合,支持跨部門協作,並提供數據驅動的建議。需具備數據分析及統計知識,熟悉數據管理工具,並具有良好的溝通及報告能力,以應對快速變化的商業環境及提升團隊協作效率。此外,需適應台灣職場的高壓氛圍,靈活應對多樣化的業務需求及跨文化團隊合作。」
關於教室
關注人數 32 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
關於教室
關注人數 32 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
Hi~ 歡迎分享學習資源,有學習問題可匿名向Giver發問!
我要分享
我要提問

資料整合 學習推薦

全部
影片
文章
Mike Ku

Learn Code With Mike品牌創辦人

2022/01/19

3個Pandas套件比較CSV檔案資料之間的差異秘訣(上)
使用Pandas套件處理多份CSV檔案資料,相信是資料分析的過程中不可或缺的任務之一,其中,很常有機會比較各個資料集的相同與不相同資料內容,藉此來瞭解差異或檢核資料整合的結果是否有誤。
所以,本文就以Kaggle網站的「Coursera Course Dataset( https://www.kaggle.com/siddharthm1698/coursera-course-dataset )」及「Course Reviews on Coursera( https://www.kaggle.com/imuhammad/course-reviews-on-coursera )」兩個資料集為例,來分享Pandas套件比較CSV檔案資料集的常用方法。
Q: Pandas檢查兩個資料集的資料是否相同
首先,利用以下指令安裝Pandas套件:
$ pip install pandas
接著,使用Pandas套件的read_csv()方法(Method),來讀取「Coursera Course Dataset(coursea_data.csv)」資料集,如下範例:
import pandas as pd
df1 = pd.read_csv('coursea_data.csv')
print(df1)
以及讀取「Course Reviews on Coursera(Coursera_courses.csv)」資料集,如下範例:
import pandas as pd
df1 = pd.read_csv('coursea_data.csv')
df2 = pd.read_csv('Coursera_courses.csv')
print(df2)
這時候,就可以透過Pandas套件的equals()方法(Method),來比較兩個資料集是否有相同的維度(shape)、資料型態(dtype)及資料內容(elements),如下範例:
import pandas as pd
df1 = pd.read_csv('coursea_data.csv')
df2 = pd.read_csv('Coursera_courses.csv')
print(df1.equals(df2)) #執行結果False
很明顯這兩個資料集的維度(shape)並不相同,所以執行結果為False。
Q: Pandas查找兩個資料集之間的相同資料
知道了兩個資料集不相同後,有時會想要知道兩個資料集皆擁有的資料(交集)有哪些,在這樣的情況下,就能夠使用Pandas套件的merge()方法(Method),透過合併的方式來進行查找。
而Pandas套件在合併兩個資料集時,至少要有一個共同的欄位名稱,所以本文就將第一個資料集的「course_title」課程名稱欄位重新命名為「name」,來當作和第二個資料集合併的共同欄位,如下範例第4行:
import pandas as pd
df1 = pd.read_csv('coursea_data.csv').rename(columns={'course_title':'name'})
df2 = pd.read_csv('Coursera_courses.csv')
接下來,就可以利用Pandas套件的merge()方法(Method)進行合併,如下範例:
import pandas as pd
df1 = pd.read_csv('coursea_data.csv').rename(columns={'course_title':'name'})
df2 = pd.read_csv('Coursera_courses.csv')
result = df1.merge(df2, how='inner')
print(result)
由於我們想要查找兩個資料集皆擁有的資料,也就是所謂的交集,所以在Pandas套件的merge()方法(Method)中,需設定how關鍵字參數(Keyword Argument)為「inner」,即可得到兩個資料集的相同資料結果。
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike(https://www.learncodewithmike.com/2021/10/pandas-compare-values-between-dataframes.html
)網站觀看更多精彩內容。
看更多
2 0 1429 0

熱門精選

104學習

產品

09/11 14:57

轉職首選!3 週從零到上手的數據分析師養成營 —— 104人力銀行 × 104學習 × 緯育 TibaMe 聯合推出
想跨入高薪、有前景,又能左右商業決策的數據分析師職涯,但擔心自己沒有程式背景、時間不夠嗎?
這堂【數據分析師學習營】或許是你理想的起點。
✨ 首次跨界合作,更強大資源整合✨
這次由 104學習精靈 首度攜手 緯育 TibaMe 聯合打造。
⚡104人力銀行 × 104學習精靈:深耕職涯數據多年,最了解台灣企業用人需求,課程更貼近市場實際職缺。
⚡緯育 TibaMe:累積多年產業培訓經驗,專注於 IT、數據、AI 等熱門技能轉職養成,培訓模式完整,輔導成效有口碑。
這樣的合作,讓學員享有真實的培訓經驗,學習效果與轉職落地率都更具保障。
課程亮點一次看
🔥3 週密集實戰:短短三週密集訓練,快速掌握職場必備技能,不必耗費半年、一年時間啃課表。
🔥零基礎設計:無需工程背景,也不用寫程式,由淺入深帶你學會資料庫查詢(SQL)與數據視覺化工具 Power BI。
🔥實戰作品累績履歷實力:課程設計強調實務操作,結訓不僅懂工具,更手上有完成的作品,讓履歷直接升級。
🔥專屬平台與支援:透過共學社群與專業助教協助,學習不再孤單。
為什麼你該報名?
🟢快速起步,快速看成果:三週聚焦提速進展,是在職或時間有限者的最佳選擇。
🟢具備市場需求核心技能:SQL 與 Power BI,完全符合企業當前的數據分析需求。
🟢履歷實力落地具體化:實作作品比起只學理論更能打動雇主眼光。
🟢104 × 緯育 TibaMe 強強聯手:把資源與專業結合,讓學習不只停留在課程,而是直通「就業」與「轉職」。
👉 立即報名,搶先卡位:超小班就50位唷!
👉 刷中信/台新/玉山可享3期0利率!
👉 超早鳥優惠領$850券報名到9/24唷!
👉 前10名解鎖送500元Line點數,第11名起送200元Line點數,更多驚喜組合購,可再額外送100元Line點數
看更多
3 0 12073 4

104學習精靈精選課程

看更多課程
想提升職場競爭力?專業技能課程看起來👇
結構式目標選才面談技巧
經過一連串的招募面談,人資單位與用人單位好不容易把人找進來了,每每在試用期間,總還是會發生新人的積極度不夠、專業知識不足、配合度不好…等狀況,或發現新人在面談所說的和實際工作情況落差很大。 以上這些不適任的理由,其實都可以在面談過程中,透過結構式的提問,對應徵者有更深入的瞭解,幫助主管與HR在進行人選評估時,有更完整、全面的資訊進行判斷。 你將可以學到: • 瞭解結構式面談的程序與準備步驟 • 清楚工作職能與人才標準的關係 • 掌握行為式選才面談要點 課程簡介: 引導學習者認識結構式選才應具備的成功七要素及招募的三階段;並瞭解要找到適合的人才需從訂定人才規格開始,這正是企業招募前最重要的基礎工程。 當有了人才需求的規格後,用人單位及HR單位就能依據此規格進行人員的篩選及遴選;整系列的課程中,也同時說明招募面談流程前/中/後應掌握的作業要點及技巧,協助主管及人資單位可以更有品質的找到符合企業需求的人才。 課程單元: 單元一:招募與結構式選才 單元二:職能導向人才標準 單元三:審閱履歷表要點 單元四:面談前的準備 單元五:面談流程與互動要點 單元六:行為事例提問 單元七:面談資料整合與決定 林素琴 講座簡介 · 臺灣行動學習協會(WIAL-TW)監事 · ICF國際教練聯盟臺灣總會(ICFTaiwan) 常務監事暨HR私董會召集人 · IAF 國際引導師協會合格會員(International Association of Facilitators) · 澳洲國際教練學院(International Coach Academy) 專業認證企業教練(CPC) · ASK123集團績效發展總監​ · 104人資學院顧問、太毅國際專任顧問授課實績:·  金融保險 日盛金控、永豐金控、元大寶來投信、保德信投信、中國太平洋保險、中國人民保險、中國平安(人壽、數科、銀行)、中德安聯保險、陸家嘴國泰、臺灣人壽、新光人壽、富邦人壽、保德信人壽、三商美邦人壽、工銀安盛保險、第一金人壽、華泰人壽、宏泰人壽、中國信託、富邦銀行、浦發銀行、遠東商銀、國泰世華銀行、法巴銀行、國泰產險、國泰證券、元富證券、元大證券、統一證券、康和證券、遠智證券、仲利國際、勤業眾信、安侯建業、三菱東京日聯銀行、安達人壽 · 科技電子 聯華電子、菲利浦、鴻海精密、台達電、英業達、友達光電、廣達電腦、台灣樂金、晶元光電、達運光電、羅姆半導體、迪芬尼聲科、冠捷科技、新武精密、威剛科技、威光自動化科技、詠業科技、住華科技、仁寶科技、撼訊科技、宏正科技、富威科技、歐朗科技、聚光科技、奕力科技、阿托科技、明泰科技、乾坤科技、台灣晶技、立端科技、奇美電子、創意電子、鉅晶電子、優力國際、宜特科技、美光記憶體、台灣愛普生、臺灣港建、勁永國際、臺灣電力、星恒電源、易能電力、阿特斯太陽光電、韓華新能源、美國動力轉換、加百裕工業、凱士比泵業、艾默生、東元電機、中國珂納電機、派克漢尼汾、西子奧的斯、日立空調、佳能半導體、麥格納國際、科林研發、捷安特、庫柏中國、捷豹路虎、福特汽車、台灣賓士、裕隆日產、TOYOTA · 流通服務業 SOGO百貨、吸引力百貨、香奈兒、歐舒丹、歷峰集團、迪悅化妝品、誠品文化、星巴克、全聯社、中信房屋、金科房產、天驕集團、亦谷服飾、鑫晨服飾、Bossini、冠彣企業、DHL、OCS、飛力達物流、中外運、海通國際汽車物流、勤時通貨運、江蘇中和集團、特力集團、報喜鳥集團、廣州智樂、中賽實業、寶盛國際、Adidas、神腦國際、馥盛、美樂家、如新、玫琳凱(中國)、六福集團、和潤… · 網絡通訊 遊戲橘子、鈊象、億泰利、京群超媒體、三商電腦、鼎新電腦、晶睿通訊、資拓科技、鴻程系統、天躍科技、潘朵信息科技、東方通信、蘇寧雲商、網易、聯動優勢、程曦資訊、勝意科技、台灣大哥大、遠傳電信、宏華國際、台灣之星、遠鑫票證、MOMO富邦媒體、資策會… · 食品醫療 上海強生(Johnson & Johnson)、台灣嬌生、博士倫、可口可樂、多美滋(Dumex)、君樂寶、美麗健乳業、思念食品、統一企業、康師傅、南橋食品、新希望六和集團、碁富食品、泰格醫藥、雷允上藥業、慈濟醫院、馬偕醫院、萬芳醫院、門諾醫院… · 建築塑化製造 亞洲水泥、大陸工程、建國工程、建發集團、永光化學、擎邦科技、冠軍磁磚、國揚實業、國民澱粉化學、ICI (China)、亞東工業、遠紡工業、飛雁紡織、昆嶺薄膜、哈利瑪化成集團、恒力化纖、駿馬奔騰塑業、台英煙草帝國、金科房產、廣西金桂漿紙…
104人資市集
4113 11

推薦給你

緯育TibaMe

14小時前

免費報名📍如何順利進入夢幻電商產業?
#最後一週免費報名 🤔電商人抗壓性都很強?甚麼特質最容易錄取?
重量級前輩來分享🟢綠界大數據總經理 Ken x ⚫小黑老師 邱煜庭
你想知道的電商圈內情報都在這!由兩位業界專家引路,帶你看懂最新產業趨勢、揭開品牌徵才標準, 讓你提早做足準備、進入理想電商職缺。
📍如何順利進入夢幻電商產業?你的電商職涯加速器
直播時間:9/23(二)20:00-21:30
📍精彩內容預告
• 在電商工作是甚麼樣貌、未來發展如何?
• 成為電商圈內人!了解品牌正面臨的挑戰與機會
• 案例分享:如何用數據驅動品牌成長
• 哪些人格特質或履歷經驗最優先錄用?
• 想進電商,現在可以先做的準備
• 《電商成長顧問養成營》獨家優勢介紹
看更多
0 0 82 0
你可能感興趣的教室