大數據正夯!許多人都想跨進數據的領域,成為資料分析師或資料科學家。就算不是立志想成為資料分析師,也越來越多人了解數據的重要性,希望將數據運用在自己的工作上,像是會計、行銷、管理等等,甚至使用數據來幫助自己做出投資理財更好的決策。但是從學生時代數學就很差,跟數字不熟,是文組生……到底怎麼跨入數據的領域呢?
此篇文章分享非常實用的一本書—《使用數據的技術:韓國星巴克第一數據科學家》,作者寫得很淺顯易懂,舉了很多比喻及實例,數據初學者也能快速上手!
以下整理書中的內容及融入個人的經驗:
1.1提出問題
數據是用來服務我們的,提出問題的那一刻,數據才有可能幫助我們,否則拿到再多數據都沒有意義。
解決任何問題之前,都要有不滿足及好奇心,好奇為什麼這個月業績成長了?而不是看到業績成長就「噢!好棒」……沒了。
1.2 設計數據
針對想解決的問題,好奇的問題,接下來要知道我們該如何設計數據,需要運用哪些數字解答。書中建議的方法很實用,叫做:拆解問題語句變成數據。
以一句話舉例:最近很流行的電商網站,那裡的包包賣得比其他地方便宜。
接著拆解:
.最近:具體時間點是什麼時候?可以用幾年、幾個月、幾週或是幾天說明嗎?
.很流行:很流行指的是什麼?銷售規模大嗎?銷售排行或成長率高嗎?是在特定族群中受歡迎嗎?在全台灣嗎?在台北嗎?還是特定年齡層經常使用的網站或服務?
.比其他地方:此電商網站的競爭對手是誰?有哪些和這個電商網站類似的商店?是只有賣包包的店嗎?還是只賣特定品牌的店?或是有賣各式各樣品牌的店?
.便宜:有多便宜?便宜幅度是10%嗎?跟全世界價格相比最便宜嗎?在網路或實體中最便宜嗎?是販賣正貨產品業者中,最便宜的嗎?所有的包包都賣得很便宜嗎?其他產品價格都差不多,但這個產品比較便宜嗎?整年度都很便宜,還是只有特定期間才便宜?
1.3 搜尋數據
接下來要用拆解句子裡的元素蒐集數據。蒐集數據不是一件簡單的事,世界上有很多很棒的公司從事販賣數據的服務,但這些服務以個人的身份未必能取可(可能價錢太高或資格不符)。
因此作者建議我們,需要絞盡腦汁思考:能夠拿到哪些數據?如果權限不足拿不到數據,有沒有其他的方法,或是有沒有哪些類似的數據可以替代?
數據依處理程度可分為四大類:
1.Log數據(原始資料)
2.數據表格(簡單加工)
3.商業儀表板(可直接應用,但難以從源頭變化)
4.報告書(可直接運用,方便操作,但沒什麼能更換的地方)
1.4 分析數據
這個步驟是作者說大家最想學,但又最難教的部分。作者建議初學者分析數據時必須抱持「大處著眼,小處著手」的心態。
大處著眼:先挑出數據中最好找,又能看到整體面貌的來仔細檢視,先做一份最有代表性的圖表,像是每日銷售、每月銷售或年度銷售等,數字隨時間推移的長條圖。
小處著手:親手從非常簡單的圖表畫起,用Excel也好,先確認歷史銷售型態,而不是先用演算模型預測銷售走向。如果自己親手做過一次,並了解其含義,下次碰到同樣情況,就能懂得運用相同手法。
2.1 拼出數據的拼圖
不要期待一個數字就能成為公司的轉捩點,重點在於要懂得用數據說故事。將多項分析洞察結果蒐集起來,能決定看到的方向。如果只靠單一分析結果難以斷定,多項數據的準確度就會提升。將分析的結果分門別類,重新排列分類好的內容,讓故事說得通順有理。
以做生意來說,可以用六何法(Who/When/Where/What/How/Why)整理答案,建議以消費者為主詞,也可以用特定店面或特定情況作為主詞。
在拼圖的過程中,若發現空白的地方要追加分析。但也要給自己決定的期限,不能無止盡分析下去。因為藉由數據得到洞察,進而採取動作改變市場,才是最重要的。
2.2 提出方向
提出方向不能講一些虛無飄渺的內容,也不能講一些人人都會講的內容,而是要提出以數據為基礎,具體且符合現實的行動方案。
範例:
(X)為了做出大眾會喜歡的產品,必須從多個角度檢視。
(X)必須做出OO口為的飲料,用OO色的包裝,必須在OO超市販賣。
(O)喜歡OO的顧客群,通常偏好OO口味和OO色。該客群經常在OO超市出沒。
2.3 數據分享
可透過商業儀表板或報告書分享數據,或選擇藉由兩者之中類似Data Studio等視覺化工具。向不同聽者報告時,需設計不同的故事大綱。(這點跟簡報的原則是類似的。)