104學習

資料蒐集

AI 專區學習課程

證照測驗共學新知

資料蒐集

關注

邀請朋友

邀請朋友

Line

Facebook

複製連結

取消

在職場上，這項技能指的是有系統地尋找、整理並分析各種相關資訊，為決策或專案提供可靠依據。具備此能力能幫助你掌握市場趨勢、了解競爭對手狀況，並找到問題的根本原因。有效的資訊掌握不僅提升工作效率，還能減少風險，讓團隊做出更精準的判斷，是現代職場不可或缺的基礎能力。

關於教室

關注人數 100 人

104人力銀行從職缺中挑選出常見技能所成立的官方教室，提供大家進行共學互動。

學習主持人

持續分享知識，
有機會成為官方教室主持人

教室標籤

Hi~ 歡迎分享學習資源，有學習問題可匿名向Giver發問！

我要分享

我要提問

資料蒐集學習推薦

職涯夢想實踐家交流平台

關注

陳琮斐

總經理(企業輔導顧問/授課講師)

2022/01/14

職場必殺技-求職密技養成術

1.個人知識累積與管理

2.客觀資料蒐集與透過人脈獲取資訊

3.技能成長與更新

4.多多加入社群

5.不斷學習與創新

6.經驗與智慧的轉化

7.化為明確的行動計畫與執行力

職場像是一場登山探險，每走一步都會有不同的驚喜及挑戰！

準備充足的人，路上將充滿驚喜；沒準備的人，將充滿問號！

看更多

2 0 641 0

拍手

留言

分享到：

Line

Facebook

複製連結

取消

收藏

Mike的Python學院

關注

Mike Ku

Learn Code With Mike品牌創辦人

2021/10/14

開發Python網頁爬蟲前需要知道的五個基本觀念

Q: 什麼是網頁爬蟲?

網頁爬蟲可以把它想像成是一種網頁機器人，能夠依照特定的模式或規則，自動化擷取網頁原始碼，來進行解析取得資料，所以被大量的應用在網頁資料蒐集。

當然網頁爬蟲部一定只能使用Python來進行實作，其它像Java、C#及JavaScript等程式語言也可以，而因為Python語法簡潔及擁有許多成熟的套件與框架，所以筆者選擇Python來開發網頁爬蟲。

Q: 網路是如何運作方式呢?

Python網頁爬蟲事實上就是模擬使用者來瀏覽網頁，這時候就需要瞭解網路的基本架構，分為用戶端(Client)及伺服端(Server)。

其中，用戶端(Client)就是使用者瀏覽網頁的裝置(例：本機電腦)，當使用者點擊網頁時，也就代表請求(Request)的動作，存取該網頁連結的伺服端(Server)，而伺服端(Server)接收連結得知使用者所要看的網頁後，將內容回應(Response)給用戶端(Client)。

這樣的網路運作方式就跟點餐的流程非常相似，當我們進到一間餐廳看著菜單，就像到一個網站瀏覽其中的網頁，接著，到櫃檯向老闆點餐的動作就像是看到喜歡的網頁，請求(Request)伺服端(Server)想看的網頁，最後，等待老闆烹飪完成送到餐桌上，像是伺服端(Server)端處理完成回應(Response)給使用者。

Q: 網頁的基本結構是什麼?

網頁是由許多的標籤(Tag)與元素(Elements)組成，並且具有階層式的結構，所以Python網頁爬蟲就需要透過定位，來取得所需的元素(Elements)。

Q: 常見的Python網頁爬蟲套件及框架

常見的Python網頁爬蟲套件及框架包含BeautifulSoup、Selenium及Scrapy。

BeautifulSoup對於HTML及XML的解析非常友善，並且容易入門使用，適用於靜態類型的網頁及小型的Python網頁爬蟲專案。

Selenium同時擁有網頁自動化測試及爬取功能，能夠搭配 JavaScript來進行爬取，所以非常適用於爬取需要滾動捲軸來動態載入資料的網站，像是電子商務或社群平台等。

Scrapy相較於BeautifulSoup及Selenium爬取速度較快且有效率，擁有非同步的功能，所以適用於爬取大量的資料及大型網頁爬蟲專案。

Q: Python網頁爬蟲有沒有標準的開發流程?

開發Python網頁爬蟲的流程，首先，會需要知道想要蒐集什麼樣的資料來進行分析或應用，接著，就可以尋找相關的網站，來分析要爬取的網頁原始碼結構，並且觀察是否有規則或模式可循，然後，選擇程式語言及適當的套件，依照分析的網頁結構及規則開發網頁爬蟲，最後，將爬取的資料依需求寫入資料庫、CSV檔案或雲端等。

如果想要學習更多的Python應用教學，歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2020/10/python-web-scraping.html )網站觀看更多精彩內容。

看更多

開發Python網頁爬蟲前需要知道的五個基本觀念

learncodewithmike.com

[Python爬蟲教學]開發Python網頁爬蟲前需要知道的五個基本觀念

2 0 1846 1

拍手

留言

分享到：

Line

Facebook

複製連結

取消

收藏

104學習精選課程

看更多課程

想提升職場競爭力？專業技能課程看起來👇

【免費報名】AI 落地師養成術：從「會用 AI」到「企業搶著要」的關鍵轉型

解密企業最缺的「AI 落地師」核心能力，並提供將 AI 工具轉化為可升遷專案成果的培訓路徑，幫助工作者達成職場轉型

超越基礎：用10個高效指令成為Python進階用戶

課程清單： 00-課程介紹與大綱 01-python初學者與進階使用者的區別 02-10個關鍵python指令函式模塊介紹 03-第1招：print 函數 04-第2招：list 數據結構 05-第3招：if-elif-else 條件語句 06-第4招：for 和 while 迴圈 07-第5招：dict 字典 08-第6招：def 自定義函數 09-第7招：lambda 匿名函數 10-第8招：import 模塊和包 11-第9招：try-except 錯誤處理 12-第10招：pandas 數據處理 13-回顧與小結

龍耀智能企業社

自動化 AI 報名系統｜從名單篩選到通知寄發一鍵搞定

【AI 百用百科】從情境到解法，用AI幫你搞定職場大小事，這門課程聚焦於自動化工作流，教你如何利用 n8n 串接 Google Forms 與 AI 工具，實現「表單提交、資料彙整、自動通知」的全自動化。透過這套 AI 解決方案解放雙手，將原本繁瑣任務縮短，大幅提升職場競爭力。

面試秘笈｜破解資料工程師，專業面試實戰題｜104獨家求職線上課

鎖定資料工程師面試３大面向｜有策略的準備，贏在起跑點 ✔ 吸睛優勢特質：重點軟實力 ✔ 關鍵核心技能：必備硬實力 ✔ 展現潛力與獨特性：加分作品集面試是成本低但高回報的投資，準備得當，便能大幅提升成功機會！

VBA網路爬蟲:高效率抓取投資資訊

利用微軟Excel VBA抓取投資資訊，零基礎也能學會！入門VBA程式語言與相關物件操作，讓你不用再慢慢手動抓取資料，擺脫資訊弱勢，將寶貴的時間用在分析資料以及擬定投資策略!

你可能感興趣的教室