隨著新冠肺炎(COVID-19)在武漢爆發至今,全球各地也都受到相當嚴重的疫情影響。
每天看著新聞,看著記者會關心各地數據的變化,想動手做點甚麼又發現光是要蒐集全球數據就頗具挑戰。
▌我的問題,似乎也是大家的問題。
剛好在三月下旬 Tableau公布了一個COVID-19 Data Hub計畫。 Tableau COVID-19 Data Hub 旨在提供公眾能透過此計畫提供的公開數據服務,看見數據、了解數據做出有效決策。
計畫中的數據由約翰霍普金斯大學(Johns Hopkins University)提供,透過Tableau Prep將其數據進行整理與清洗,提供全球各國每日疫情的確診死亡案例數,部分國家還可以細看到州/省的數字。
點入該計畫網頁,可以看到由Tableau與Tableau Community 提供的疫情分析視圖之外,還可以找到Tableau的公眾數據服務連接方式。
▌Tableau COVID-19 Data Hub 目前提供三種數據連接方式:
Amazon Web Services (AWS)透過AWS的數據平台,適合已經具有AWS帳號與相關使用經驗者。
data.world可以透過data.world 平台直接下載CSV or Hyper 格式的數據檔案,此外data.world 也提供Tableau Web Data Connector (WDC) 連接。CSV or Hyper 下載使用很方便,但必須每日自己手動下載更新數據;如果使用WDC 可以讓Tableau 每次開啟時就直接連到data.world 就取得最新數據。
Google Sheets:如果你是使用Tableau Public,加上你想要把最終的視圖發布在網路上,那使用Google Sheets是最適合的選擇。只要先開啟 View in Google Sheets 之後就可以在Tableau Desktop/Tableau Public上開啟Google Sheets 連接器來創建自己的分析。加上,Tableau Public 可以每隔24小時重新擷取來源為Google Sheets的數據,做完的視圖就可以放心讓它自動更新囉。
▌看到這,是不是也想動手做做看!!
以下簡單示範如何使用Tableau Public連接數據,以及完成後發布視圖,如果你是使用Tableau Desktop只有在最後發布時的步驟略有不同。
1.先開啟資料集的連結 View in Google Sheets你會在此發現,Google Sheets 檔案名稱為”COVID-19 Cases”,且數據分為兩個Sheets,分別是COVID-19 Deaths & COVID-19 Confirmed
兩個Sheets欄位資料型態都相同,實際上就是一個是確診,另一個是死亡的數據,我們可以稍後在Tableau當中把它們合併起來就好。
2.開啟Tableau Public,並選擇資料來源”Google表格”,這時會需要在瀏覽器視窗確認同意Tableau 連接您的Google Sheets。完成後就可以看到如下畫面,找到COVID-19 Cases,就可以點選右下角的連接。
3.在Tableau 資料來源頁籤,因為我們已經知道資料分布在兩個不同的Sheets,所以先選擇新建並集(Union)
然後因為我們兩個Sheets都要,所以直接選擇”萬用字元(自動)”,Tableau就會幫我們把COVID-19 Cases檔案下所有sheets都合併起來。
4.完成並集後,數據就已經乾淨整齊的可以使用囉。各個欄位資訊基本上如其名稱不難了解,也可以參照 View in AWS Data Exchange在AWS這邊有詳細說明。
5.有了數據後,再來就是您的時間囉! 花點時間思考用甚麼角度,用甚麼方式來看這數據。完成分析視圖後,就可以分享給全世界!!!
6.如何將工作簿發布至Tableau Public呢?在工具列當中,直接點選儲存(CTRL+S)再輸入工作簿在Tableau Public的標題,並記得勾選嵌入Google憑證發布後會自動開啟瀏覽器視窗,可以編輯詳細資訊。
7.詳細資訊中可以開啟/關閉[使用Google工作表更新資料],也可以要求立即進行更新數據,未來隨時都可以進來調整。
8.如果還想將工作簿分享給其他人或嵌入自己的Blog/網站,可以在視圖右下方取得直接鏈結與嵌入代碼。