成為數據分析師的第一把鑰匙:用Python實作三個資料分析專案
課程介紹
人力銀行徵才上,不只是資訊科技業,而是化工業、台灣大車隊、金融業、電信業、甚至是房仲業,各行各業都在搶數據分析師!
徵才月薪至少有四萬元以上,對於大學畢業生及工作一兩年想轉職的人,都是極佳的投入機會。 想要當數據分析師,不一定非要資工資管背景,跟著容噗老師學習,文科生也能轉職成為數據分析師!
有別於市面上的資料分析課程都是以程式教學為大宗,非工科生有點難以進入。
容噗老師以非工科生成功轉為數據分析師的經驗、第一線職場實戰角度出發,來設計這門課程,適合零基礎、初入門、想轉職作數據分析師的你!
學會本課,讓你徹底掌握數據分析師的必備技能,充分的模擬資料分析練習,學完還讓你帶走三個具有高度移植性的資料分析專案,提供程式碼下載,以利與職場接軌。 文科生不用怕,容噗老師會教導Python基本程式邏輯及技巧,懂了邏輯,運用網路免費程式資源將如魚得水!
為什麼需要這門課?
資料分析演算法眾多,到底哪些才是第一線在用的? 別多花時間學用不到的,學習最實用的數據分析實戰技巧!
分析思維與職場溝通不是看看網路文章就可以簡單學會的,一份資料的分析方向是需要透過自己清晰的思路,以及與各單位溝通結果來決定的。
看圖說分析的檢討報告時代已過,老闆們更想知道的是未來會發生甚麼事,Python的預測模組非常完善,本次課程會帶領學員正式接觸預測模型。
大數據時代下,資料量日與遽增,傳統Excel能處理的資料量有限,Python這種程式語言會是未來的趨勢。
以最短的時間輕鬆上手Python工具,邁入數據分析師的領域。
課程大綱
PART1: 數據分析師簡介
大數據及常見分析工具的介紹,R、Python、SQL、Excel優缺點
數據分析師的專業技能: 資料整理、資料分析、分析報告
數據分析師的職場定位&工作夥伴
學習資源介紹: Kaggle平台操作 & YouTube 頻道介紹
PART2: PYTHON基礎
Python – Anaconda安裝
Python – Spyder啟用
Python – 介面介紹
Python – 套件安裝
Python – Pandas、sklearn套件介紹
Python – 函式介紹與使用
PART3: PYTHON新手村: 巨量資料整理
資料整理 vs 資料清理
Pandas – data格式簡介&檔案讀取與輸出
Pandas – 行列整理、篩選
Pandas – 排序、移除重複、取代
Pandas – 格式轉換(character、date、float、int)
Pandas – 合併、串接
Pandas – 字串取代、篩選、合併
Pandas – 樞紐
PART4: FACEBOOK用戶資料探索(EDA) - 模擬公司會員資料(CRM)
你將學習到本專案藉由Facebook資料來模擬職場真實的會員資料(CRM),透過一層層收斂的分析邏輯,準確提供需求方有用的資訊,例如男性會員與女性會員的價值差異,哪些客群應該投入更大的行銷資源,以換取更大的利益。
常用統計量的應用說明: 四分位、眾數、MSE、MAE、MAPE、R2、acc
資料探索(EDA)
資料清洗 – NA值處理
資料清洗 – 離群值處理
資料視覺化
資料探索結論
提供程式碼下載
PART5: IKEA 商品折扣預測 - 模擬公司商品銷售資料
你將學習到本專案藉由IKEA資料來模擬職場真實的商品銷售資料,透過一層層收斂的分析邏輯,預測哪些商品該給予折扣,哪些商品不用,以避免公司內折,換取更大的利益。
分析需求確認 | vs 行銷人員&主管&老闆
資料探勘 | vs 資料庫人員: 資料理解
資料探勘 | 隨機森林、XGBoosting、SVM演算法教學
特徵篩選 | R2教學
特徵壓縮 | PCA教學
隨機抽樣 | 28 & 37法則
模型調參 | 各演算法重要參數說明
模型診斷 | 損失函數說明
模型結果說明
提供程式碼下載
PART6: 特斯拉股價預測 - 模擬公司營收資料
你將學習到本專案藉由特斯拉資料來模擬職場真實的營收資料,透過一層層收斂的分析邏輯,預測未來的股票價格,讓高層了解公司未來走向,提早做好策略。
特斯拉股價預測
預測盲點補充
模型準確度不佳怎麼辦?
提供程式碼下載
300%解鎖: 模擬客服文字資料第1步 - GOOGLE評論資料清理
專案說明:本專案藉由Google評論資料來模擬職場真實的客服文字資料,無論是公司內部或是網路輿情,文字資料無所不在,就讓容噗老師由文字資料清理,帶你進入自然語言處理(NLP)的領域吧。
安裝套件by終端機
文字資料介紹&整理 – jieba斷詞
文字資料清洗 – stopword
500%解鎖: 模擬客服文字資料第2步 - GOOGLE評論資料探索
專案說明:本專案藉由Google評論資料來模擬職場真實的客服文字資料,透過一層層收斂的分析邏輯,快速理解民眾每天所討論的內容,節省人工閱讀的時間。
文字常用統計量 – TF-IDF
文字資料視覺化
文字資料探索結論
700%解鎖: 模擬客服文字資料第3步 - GOOGLE評論資料探勘
專案說明:本專案藉由Google評論資料來模擬職場真實的客服文字資料,透過一層層收斂的分析邏輯,抓出風向者、關鍵主題,節省人工閱讀評論的時間。
文字資料探勘 – 風向者偵測
文字資料探勘 – 主題挖掘LDA演算法
1000%解鎖: GITHUB介紹 程式人用的GOOGLE CLOUD
如何用 GitHub 製作履歷,增加轉職成功率
教師介紹
容噗老師
學歷:東吳大學資料科學系碩士
專長:巨量資料分析、統計檢定、機器學習(預測建模)、跨部門溝通
經歷:上市櫃公司之數據分析師
教學經驗:YouTube千人訂閱教學頻道-- 容噗玩Data、R語言線上講師
Mastertalks