104學習

Selenium

AI 專區學習課程

證照測驗共學

Selenium

關注

邀請朋友

Line

Facebook

複製連結

取消

「Selenium：負責自動化測試框架的設計與實施，確保應用程式的品質與穩定性。主要職責包括撰寫和維護自動化測試腳本，與開發團隊及產品經理緊密協作，分析測試結果並提供改進建議。需具備熟練的編程能力，尤其是Java或Python，良好的溝通技巧，以及跨部門協作的經驗，以應對快速變化的開發環境。此外，擅長使用測試管理工具及持續集成平台，以提升測試效率及品質管理。在台灣職場中，需要適度應對時間壓力與多任務處理的挑戰。」

關於教室

關注人數 45 人

104人力銀行從職缺中挑選出常見技能所成立的官方教室，提供大家進行共學互動。

學習主持人

持續分享知識，
有機會成為官方教室主持人

教室標籤

Selenium

Hi~ 歡迎分享學習資源，有學習問題可匿名向Giver發問！

我要分享

我要提問

Selenium 學習推薦

全部

影片

文章

Mike的Python學院

關注

Mike Ku

Learn Code With Mike品牌創辦人

2021/12/21

在Scrapy框架整合Selenium套件爬取動態網頁的實作

本文以Accupass網站的精選活動為例，來分享Scrapy框架整合Selenium套件，開發Python網頁爬蟲的流程。

Q: 如何建立Scrapy網頁爬蟲?

首先，利用以下指令安裝Scrapy框架：

$ pip install scrapy

接著，新增一個資料夾，並且使用命令提示字元切換到該資料夾的目錄下，建立Scrapy專案，如下：

$ scrapy startproject accupass_scraper .

有了專案後，就能夠利用以下指令建立Scrapy網頁爬蟲：

$ scrapy genspider accupass accupass.com

Q:如何安裝scrapy-selenium套件?

而Scrapy框架想要使用Selenium套件來發送請求與接收回應，就需要一個Middleware來使用Selenium套件。

其中的Middleware，也就是在Scrapy發送請求前，以及將回應結果傳給Scrapy網頁爬蟲前，能夠在Middleware中來進行前處理。

所以，Scrapy框架想要使用Selenium套件來發送請求與接收回應結果，就需要定義Middleware，當然，已經有大大寫好了scrapy-selenium Middleware可以使用，安裝方式如下指令：

$ pip install scapy-selenium

接下來，前往下載Selenium的瀏覽器驅動，並且放置於Scrapy專案資料夾中。開啟settings.py檔案，加入scrapy-selenium Middleware的相關設定，如下範例：

DOWNLOADER_MIDDLEWARES = {

'scrapy_selenium.SeleniumMiddleware': 800

}

SELENIUM_DRIVER_NAME = 'chrome'

SELENIUM_DRIVER_EXECUTABLE_PATH = 'chromedriver.exe'

SELENIUM_DRIVER_ARGUMENTS = ['-headless']

Q:如何Scrapy整合Selenium爬取動態網頁?

開啟Scrapy專案的accupass.py檔案，引用scrapy-selenium的SeleniumRequest模組，如下範例：

import scrapy

from scrapy_selenium import SeleniumRequest

而想要讓Scrapy框架使用Selenium套件發送請求，就可以新增start_requests()方法，如下範例：

class AccupassSpider(scrapy.Spider):

name = 'accupass'

allowed_domains = ['accupass.com']

start_urls = ['http://accupass.com/']

def start_requests(self):

yield SeleniumRequest(url='https://www.accupass.com/?area=north', callback=self.parse)

以上的callback參數就是收到網頁的回應結果之後，所要執行的方法，也就是爬取網頁上的資料，如下範例：

class AccupassSpider(scrapy.Spider):

name = 'accupass'

allowed_domains = ['accupass.com']

start_urls = ['http://accupass.com/']

def start_requests(self):

yield SeleniumRequest(url='https://www.accupass.com/?area=north', callback=self.parse)

def parse(self, response):

titles = response.css("p.style-f13be39c-event-name::text").getall()

for title in titles:

print(title)

如果想要學習更多的Python應用教學，歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/11/scrapy-integrate-with-selenium.html

)網站觀看更多精彩內容。

看更多

learncodewithmike.com

[Scrapy教學12]在Scrapy框架整合Selenium套件爬取動態網頁的實作指南

3 0 795 2

拍手

留言

分享到：

Line

Facebook

複製連結

取消

104學習

10/24 00:00

youtube.com

[爬蟲實戰] 如何使用Selenium 抓取驗證碼?

94 0

分享到：

Line

Facebook

複製連結

取消

Mike的Python學院

關注

Mike Ku

Learn Code With Mike品牌創辦人

2021/12/21

掌握3個降低Scrapy網頁爬蟲被封鎖的技巧

Q: Scrapy網頁爬蟲框架如何輪流替換User-Agent(使用者代理)?

在Scrapy網頁爬蟲爬取網頁時，網站都會使用User-Agent(使用者代理)來識別所使用的瀏覽器版本資訊，而當Scrapy網頁爬蟲每次爬取都使用相同的User-Agent(使用者代理)，就很容易被懷疑是網頁爬蟲而被封鎖。

所以，如果Scrapy網頁爬蟲在發送請求的過程中，隨機使用不同的User-Agent(使用者代理)，就可以大幅降低被偵測的風險。

而要達到這樣的功能，就能夠利用以下指令來安裝scrapy-user-agents套件，讓Scrapy網頁爬蟲能夠隨機取用不同的User-Agent(使用者代理)：

$ pip install scrapy-user-agents

接著，開啟Scrapy網頁爬蟲專案的settings.py檔案，在DOWNLOAD_MIDDLEWARES的地方，加入以下的設定：

DOWNLOADER_MIDDLEWARES = {

'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None,

'scrapy_user_agents.middlewares.RandomUserAgentMiddleware': 400,

}

Q: Scrapy網頁爬蟲框架如何輪流替換Proxy IP(代理服務器IP)?

同樣，如果Scrapy網頁爬蟲都使用相同的IP發送請求，很容易會被反爬蟲網站發現而封鎖。這時候，就會需要隨機使用不同的Proxy IP(代理服務器IP)，降低被偵測的風險。

可以利用以下指令安裝scrapy-rotating-proxies套件，來達成上述的效果：

$ pip install scrapy-rotating-proxies

開啟Scrapy網頁爬蟲傳案的settings.py檔案，加入以下的設定：

ROTATING_PROXY_LIST_PATH = '/path/my_proxies.txt'

DOWNLOADER_MIDDLEWARES = {

'rotating_proxies.middlewares.RotatingProxyMiddleware': 610,

'rotating_proxies.middlewares.BanDetectionMiddleware': 620,

}

其中，在自訂的Proxy IP檔案(my_proxies.txt)中加入Proxy IP，如下範例：

ROTATING_PROXY_LIST = [

'proxy_ip_1:8000',

'proxy_ip_2:8031',

...

]

Q: Scrapy網頁爬蟲框架如何使用無頭瀏覽器(Headless Browser)?

無頭瀏覽器(Headless Browser)也就是沒有圖形化的使用者介面瀏覽器，能夠模擬使用者在網頁上的操作，降低反爬蟲網站的偵測。

其中，Selenium就是最常被用來啟用無頭瀏覽器(Headless Browser)的套件，而Scrapy結合Selenium套件的實作方式可以參考[Scrapy教學12]在Scrapy框架整合Selenium套件爬取動態網頁的實作指南文章( https://www.learncodewithmike.com/2021/11/scrapy-integrate-with-selenium.html )。

當然，除了本文所分享的3個Scrapy網頁爬蟲克服反爬蟲網站的方法外，還可以參考[Python爬蟲教學]7個降低Python網頁爬蟲被偵測封鎖的實用方法文章( https://www.learncodewithmike.com/2020/09/7-tips-to-avoid-getting-blocked-while-scraping.html )，不外乎就是避免像Python網頁爬蟲機器人一樣有規則模式的爬取資料，才有機會不被反爬蟲網站抓到唷。

如果想要學習更多的Python應用教學，歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/12/3-tips-for-scrapy-without-getting-blocked.html

)網站觀看更多精彩內容。

看更多

learncodewithmike.com

[Scrapy教學13]掌握3個降低Scrapy網頁爬蟲被封鎖的技巧

2 0 1112 2

拍手

留言

分享到：

Line

Facebook

複製連結

取消

104學習

07/14 00:00

youtube.com

【python】selenium 網頁自動化、網路爬蟲 #爬蟲 #python爬蟲 #自動化

188 6

分享到：

Line

Facebook

複製連結

取消

推薦給你

職場熱門證照排行榜

關注

104學習

產品

10/13 16:32

Canva免費證照速攻！快速考證指南

Canva一直是許多職場人士的必備工具，但除了強大的設計功能外，很少人知道旗下Canva Design School還提供許多Canva免費課程，部分課程完成後，還能透過考試取得官方Canva證照。這份攻略將詳細介紹如何獲取證書，幫助你快速掌握Canva基本功、熟悉最新的AI工具應用，有效提升職場技能。

⚡Canva免費考證 FAQ 完整攻略⚡

✅Q1：如何找到Canva官方的免費課程與證書考試？

A：首先進入Canva Design School，在平台上，點擊「Get certified」，這裡提供的課程在結束後都可參加考試並獲得證書。

證照資訊: https://nabi.104.com.tw/ability/10049184

*即使沒有將課程上完，也可直接點擊「Earn a certificate」開始考試。對於已經熟悉Canva操作的使用者來說，若覺得課程內容簡單，想要節省時間，可直接選擇考試的方式獲得證書。

✅Q2：有哪些推薦的免費認證課程？

A：Canva提供了多門適合不同需求的課程，例如：

• Canva Essentials(Canva基礎操作)：適合初學者快速建立Canva使用能力，涵蓋基礎介面、功能及AI輔助工具。 https://nabi.104.com.tw/ability/10049184

• Marketing with Canva(行銷設計技巧)：教導如何利用Canva製作符合品牌風格的社群貼文、廣告素材，提升行銷效率。

• Graphic design essentials(平面設計基礎)：學習設計的基本元素、原則、色彩理論與字體排版。

還有「Canva for Work」（職場應用）及教育類的「AI in the Classroom」等課程…

✅Q3：想快速拿證照，一定要把所有課程看完嗎？

A：不一定需要。對於已經熟悉Canva操作的資深用戶來說，即使沒有將課程上完，也可直接點擊「Earn a certificate」開始考試，藉此節省時間。考試題目為選擇題或多選題，數量介於20到30題之間。不過，若是Canva新手，建議還是完整將課程看完後再考試，除了能穩固基本功外，也能在答題時減少錯誤的機率。

✅Q4：Canva證書有什麼實際用途？如何分享？

A：Canva的證照不僅實用且免費，能夠證明您與時俱進，擁有數位設計與AI應用的專業能力。通過測驗的學員可獲得官方電子證書下載保存，或將證書分享到履歷表，為履歷及職涯形象加分。

看更多

4 0 902 1

拍手

留言

分享到：

Line

Facebook

複製連結

取消

你可能感興趣的教室