繼上週我們介紹資料視覺化之後,我們這禮拜延續視覺化議題,
本週來看看Python網頁爬蟲如何運作? 取回的資料如何處理?
如何轉換為視覺呈現? 最後還必須學會如何分析資料。
課程開始,老師其實點出「確認問題與需求」的必要性;
也就是說,要做網頁爬蟲、資料收集之前,最重要的其實是「命題」。
如果沒有明確的命題,就會導致錯誤或無用的資料爬取。
確認命題後,其實可以先搜尋有沒有相關資料範本 (或模型),將收集到的範本與命題比對,
針對相異之處進行修改,如此的作法,其實可以更快速的形成自己要的模型,
並且可以避免自行開發的過程中,可能出現的遺漏或錯誤風險。
當資料收集達預期規模後,就要進入資料處理與分析階段;
這階段將會分享Python資料處理方法,及資料處理後的分析工具、方法。
並且在分析之後,若要製作報告,則要進入另一個重點就是視覺呈現。
本課程的視覺呈現重點,包括:圖表製作工具matplotlib、seaborn的操作使用,
圖表繪製的要點。最後,會導引各位去 TQC+ Python 3 認證流程、認證考試重點提要。
連續兩週關於視覺化課程推薦,希望確實參與課程的夥伴,
可以有機會將資料視覺化的技能建立起來,這樣對於往後在職場上,
將會出現更多的機會呈現您的技術能力。
推薦課程網址:
祝您 工作順利、學習愉快
104學習精靈小編 陪您每日學習成長1%