104學習

JSON

JSON
關注
邀請朋友
邀請朋友

Line

Facebook

複製連結

取消
```JSON { "角色描述": { "主要責任": "負責設計並開發高效的數據互動介面,確保系統間數據交流的穩定性和準確性,推動數據驅動的業務決策,並進行性能優化以創造最佳使用者體驗。", "目標": "提升數據解析效率與系統整合能力,支持公司在市場競爭中的數據優勢。", "技能要求": "精通JSON數據格式,熟悉API設計與開發,具有良好的跨部門協作能力與溝通技巧,能夠解釋技術細節給非技術人員,具備問題解決能力以及良好的時間管理技巧。", "職場挑戰": "在台灣多元文化的職場環境中,需要對不同部門及技術團隊之間的需求進行有效調整,適應快速變化的科技趨勢並保持敏捷開發的思維。" } } ```
關於教室
關注人數 8 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
關於教室
關注人數 8 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
Hi~ 歡迎分享學習資源,有學習問題可匿名向Giver發問!
我要分享
我要提問

JSON 學習推薦

全部
影片
文章
Mike Ku

Learn Code With Mike品牌創辦人

2021/12/29

快速入門Scrapy框架的5個執行模組及架構
一般想要自動化蒐集網頁上的資料時,普遍都會使用像BeautifulSoup或Selenium套件開發Python網頁爬蟲來取得,但是,如果所要爬取的資料量較大,擁有複雜的邏輯處理及效率的要求,這時候就會建議使用Scrapy框架,來幫助開發人員建立一個維護性較好的Python網頁爬蟲。
而要使用Scrapy框架來開發大型的Python網頁爬蟲專案前,本文就先來帶大家瞭解一下Scrapy框架。
Q:Scrapy框架是什麼?
Srapy是一個網頁爬蟲「框架」,擁有完整的Python網頁爬蟲開發功能,也提供開發人員能夠進行客製化,並且,有一定的專案架構及執行流程,所以在未來的維護上較為容易。
另外,Scrapy框架是基於Twisted非同步網路框架所建立的,執行效率也非常的好,適用於大型的Python網頁爬蟲專案。而Scrapy框架與常應用於網頁爬蟲的BeautifulSoup及Selenium套件比較,可以參考BeautifulSoup vs Selenium vs Scrapy三大Python網頁爬蟲實作工具的比較( https://www.learncodewithmike.com/2020/11/beautifulsoup-vs-selenium-vs-scrapy-for-python-web-scraping.html )文章。
Q:Scrapy框架模組包含哪些?
Scrapy框架是由以下5個主要模組結合而成,各自有負責的職責,來達成有效率的非同步Python網頁爬蟲,其中每個模組的功能說明如下:
1.SPIDERS(爬蟲程式):撰寫Python網頁爬蟲程式碼的地方,向ENGINE(引擎)發送網頁請求,以及將ENGINE(引擎)所接收的回應結果進行解析與爬取。
2.ENGINE(引擎):Scrapy框架的核心模組,就像汽車的引擎一樣,負責控制各個模組、傳遞請求及資料。
3.SCHEDULER(調度器):將ENGINE(引擎)所接收的SPIDERS(爬蟲程式)請求進行列隊,也就是排隊的意思,來調度請求的順序。
4.DOWNLOADER(下載器):負責下載ENGINE(引擎)接收到SCHEDULER(調度器)調度請求的網頁HTML原始碼,提供回應結果給ENGINE(引擎)。
5.ITEM PIPELINE(資料模型管道):將SPIDERS(爬蟲程式)所取得的資料進行後續處理,像是資料清理、存入資料庫(例:MySQL)或存入檔案文件(例:CSV、JSON)等。
Q:Scrapy框架執行流程是如何運作的?
對Scrapy框架的5個主要模組有一個基本的認識後,各個模組間的關係及執行流程又是什麼呢?
1.ENGINE(引擎)接收SPIDERS(爬蟲程式)所發送的一至多個請求。
2.ENGINE(引擎)將請求傳遞給SCHEDULER(調度器)進行列隊。
3.ENGINE(引擎)向SCHEDULER(調度器)提取下一個所要發送的請求。
4.ENGINE(引擎)將請求傳遞給DOWNLOADER(下載器)。
5.DOWNLOADER(下載器)將ENGINE(引擎)傳遞的請求網頁HTML原始碼下載下來,並且回應結果給ENGINE(引擎)。
6.ENGINE(引擎)將回應的結果傳遞給SPIDERS(爬蟲程式)。
7.SPIDERS(爬蟲程式)進行結果的解析及資料的爬取,組成ITEMS,傳遞給ENGINE(引擎)或發送新的請求。
8.ENGINE(引擎)判斷SPIDERS(爬蟲程式)所傳遞過來的如果是ITEMS(資料),就會傳遞給ITEM PIPELINES(資料模型管道),進行後續的資料清理及儲存等。反之,如果傳遞過來的是新的請求,也就是相當於第一個步驟,接著,傳遞給SCHEDULER(調度器),以此類推,重覆這樣的流程,直到SCHEDULER(調度器)沒有請求為止。
本文簡單介紹了Scrapy是一個功能完整與快速的Python網頁爬蟲框架,包含5個主要模組,各司其職,藉由ENGINE(引擎)來進行整合,並且依照一定的執行流程,來達成非同步的網頁資料爬取,適用於大型且複雜的Python網頁爬蟲專案,希望接下來的系列教學內容能夠幫助大家對Scrapy框架有一個基本的認識。
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2020/12/python-scrapy-architecture.html )網站觀看更多精彩內容。
看更多
2 0 826 2
104學習

04/02 00:00

190 3
104學習

04/05 00:00

446 2

推薦給你

104學習

產品

10/13 16:32

Canva免費證照速攻!快速考證指南
Canva一直是許多職場人士的必備工具,但除了強大的設計功能外,很少人知道旗下Canva Design School還提供許多Canva免費課程,部分課程完成後,還能透過考試取得官方Canva證照。這份攻略將詳細介紹如何獲取證書,幫助你快速掌握Canva基本功、熟悉最新的AI工具應用,有效提升職場技能。
⚡Canva免費考證 FAQ 完整攻略⚡
✅Q1:如何找到Canva官方的免費課程與證書考試?
A:首先進入Canva Design School,在平台上,點擊「Get certified」,這裡提供的課程在結束後都可參加考試並獲得證書。
*即使沒有將課程上完,也可直接點擊「Earn a certificate」開始考試。對於已經熟悉Canva操作的使用者來說,若覺得課程內容簡單,想要節省時間,可直接選擇考試的方式獲得證書。
✅Q2:有哪些推薦的免費認證課程?
A:Canva提供了多門適合不同需求的課程,例如:
• Canva Essentials(Canva基礎操作):適合初學者快速建立Canva使用能力,涵蓋基礎介面、功能及AI輔助工具。 https://nabi.104.com.tw/ability/10049184
• Marketing with Canva(行銷設計技巧):教導如何利用Canva製作符合品牌風格的社群貼文、廣告素材,提升行銷效率。
• Graphic design essentials(平面設計基礎):學習設計的基本元素、原則、色彩理論與字體排版。
還有「Canva for Work」(職場應用)及教育類的「AI in the Classroom」等課程…
✅Q3:想快速拿證照,一定要把所有課程看完嗎?
A:不一定需要。對於已經熟悉Canva操作的資深用戶來說,即使沒有將課程上完,也可直接點擊「Earn a certificate」開始考試,藉此節省時間。考試題目為選擇題或多選題,數量介於20到30題之間。不過,若是Canva新手,建議還是完整將課程看完後再考試,除了能穩固基本功外,也能在答題時減少錯誤的機率。
✅Q4:Canva證書有什麼實際用途?如何分享?
A:Canva的證照不僅實用且免費,能夠證明您與時俱進,擁有數位設計與AI應用的專業能力。通過測驗的學員可獲得官方電子證書下載保存,或將證書分享到履歷表,為履歷及職涯形象加分。
看更多
4 0 1175 1
你可能感興趣的教室