104學習

XML

XML
關注
邀請朋友
邀請朋友

Line

Facebook

複製連結

取消
是一種用來結構化和儲存資料的標記語言,廣泛應用於資料交換、系統整合和網頁設計。具備此技能能協助職場人士有效處理跨平台資料傳輸,提升系統相容性與維護效率,特別在資訊科技、軟體開發及數據管理相關工作中非常重要。熟悉其語法與應用,有助於優化資料流程及自動化工作,提高工作效能。
關於教室
關注人數 6 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
關於教室
關注人數 6 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
Hi~ 歡迎分享學習資源,有學習問題可匿名向Giver發問!
我要分享
我要提問

XML 學習推薦

Mike Ku

Learn Code With Mike品牌創辦人

2021/10/14

開發Python網頁爬蟲前需要知道的五個基本觀念
Q: 什麼是網頁爬蟲?
網頁爬蟲可以把它想像成是一種網頁機器人,能夠依照特定的模式或規則,自動化擷取網頁原始碼,來進行解析取得資料,所以被大量的應用在網頁資料蒐集。
當然網頁爬蟲部一定只能使用Python來進行實作,其它像Java、C#及JavaScript等程式語言也可以,而因為Python語法簡潔及擁有許多成熟的套件與框架,所以筆者選擇Python來開發網頁爬蟲。
Q: 網路是如何運作方式呢?
Python網頁爬蟲事實上就是模擬使用者來瀏覽網頁,這時候就需要瞭解網路的基本架構,分為用戶端(Client)及伺服端(Server)。
其中,用戶端(Client)就是使用者瀏覽網頁的裝置(例:本機電腦),當使用者點擊網頁時,也就代表請求(Request)的動作,存取該網頁連結的伺服端(Server),而伺服端(Server)接收連結得知使用者所要看的網頁後,將內容回應(Response)給用戶端(Client)。
這樣的網路運作方式就跟點餐的流程非常相似,當我們進到一間餐廳看著菜單,就像到一個網站瀏覽其中的網頁,接著,到櫃檯向老闆點餐的動作就像是看到喜歡的網頁,請求(Request)伺服端(Server)想看的網頁,最後,等待老闆烹飪完成送到餐桌上,像是伺服端(Server)端處理完成回應(Response)給使用者。
Q: 網頁的基本結構是什麼?
網頁是由許多的標籤(Tag)與元素(Elements)組成,並且具有階層式的結構,所以Python網頁爬蟲就需要透過定位,來取得所需的元素(Elements)。
Q: 常見的Python網頁爬蟲套件及框架
常見的Python網頁爬蟲套件及框架包含BeautifulSoup、Selenium及Scrapy。
BeautifulSoup對於HTML及XML的解析非常友善,並且容易入門使用,適用於靜態類型的網頁及小型的Python網頁爬蟲專案。
Selenium同時擁有網頁自動化測試及爬取功能,能夠搭配 JavaScript來進行爬取,所以非常適用於爬取需要滾動捲軸來動態載入資料的網站,像是電子商務或社群平台等。
Scrapy相較於BeautifulSoup及Selenium爬取速度較快且有效率,擁有非同步的功能,所以適用於爬取大量的資料及大型網頁爬蟲專案。
Q: Python網頁爬蟲有沒有標準的開發流程?
開發Python網頁爬蟲的流程,首先,會需要知道想要蒐集什麼樣的資料來進行分析或應用,接著,就可以尋找相關的網站,來分析要爬取的網頁原始碼結構,並且觀察是否有規則或模式可循,然後,選擇程式語言及適當的套件,依照分析的網頁結構及規則開發網頁爬蟲,最後,將爬取的資料依需求寫入資料庫、CSV檔案或雲端等。
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2020/10/python-web-scraping.html )網站觀看更多精彩內容。
看更多
2 0 1791 1
Mike Ku

Learn Code With Mike品牌創辦人

2021/10/13

三大Python網頁爬蟲實作工具的比較
Q: Python有哪些常見的網頁爬蟲工具呢?
要實作Python網頁爬蟲,最受歡迎的三大工具莫過於BeautifulSoup、Selenium及Scrapy,其中各自的主要特色以及使用時機,接下來就來為大家進行簡單的分享與比較。
BeautifulSoup是一個擷取HTML/XML內容的套件,提供了非常多友善的方法(Method),協助開發人員可以快速搜尋及取得HTML/XML中的元素,也因此被廣泛的應用在Python網頁爬蟲的技術上。
但是它並無法單獨完整實現Python網頁爬蟲的整個流程,像是發送請求與解析下載的HTML原始碼,所以需要requests及html.parser或lxml解析器等相依性模組來協助。
Selenium是一個網頁自動化測試的套件,擁有許多網頁操作的方法(Method),像是自動化輸入資料、點擊按鈕及滾動捲軸等,同時具備網頁元素擷取與操作的功能,讓開發人員能夠輕鬆撰寫網頁的自動化測試腳本。
Scrapy本身就是一個網頁爬蟲框架,提供完整的網頁爬蟲開發功能,像是發送請求、檔案匯出、例外處理機制、偵錯(Debug)等,並且是基於Twisted非同步網路框架所建立的,所以能夠非同步的發送請求(Request),有較佳的執行速度,學習曲線也較高。
另外,由於Scrapy是一個框架,所以有一定的專案架構及執行流程,除了未來很好維護外,也能夠輕鬆的移轉既有的專案到另一個專案。
Q: BeautifulSoup、Selenium及Scrapy各有什特色?
BeautifulSoup學習曲線較低,非常容易上手,並且適用於靜態網頁的爬取。
而Selenium能夠輕鬆與JavaScript的事件合作,可以處理網頁的AJAX請求及自動化操作網頁上的元素。
Scrapy執行速度較快,允許客製化功能來進行擴充,內建多種檔案格式輸出(JSON、XML、CSV),支援XPath及CSS表達式來擷取資料,擁有完善的互動式偵錯工具(Scrapy Shell)。
Q: BeautifulSoup、Selenium及Scrapy的使用時機?
對於初學者想要學習入門Python網頁爬蟲,或是僅針對特定少數網頁進行爬取的小型專案,就可以選擇BeautifulSoup套件。
當所要爬取的網頁有使用JavaScript / AJAX等動態載入資料的技術,或是具有登入驗證、搜尋機制的網頁,就能夠利用Selenium套件的網頁操作方法(Method),來開發Python網頁爬蟲。
Scrapy則適用於大型的Python網頁爬蟲專案,有一定的效率要求及需要處理複雜的爬取邏輯。
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2020/11/beautifulsoup-vs-selenium-vs-scrapy-for-python-web-scraping.html )網站觀看更多精彩內容。
看更多
4 0 2286 2

熱門精選

104學習

產品

2小時前

2026 年 Prompting 怎麼學?AI大神吳恩達推出免費新課給一般人的 AI 使用指南
AI 工具越來越強,提示詞也不再只是「請幫我寫一段文案」這麼簡單。AI 教育者吳恩達(Andrew Ng)近期推出新課程《AI Prompting for Everyone》,主打不需要技術背景,幫助一般使用者學會更有效地使用 ChatGPT、Claude、Gemini 等 AI 工具。DeepLearning.AI 課程頁顯示,這是一門初學者課程,共 3 小時 4 分鐘、21 堂影片課,由吳恩達授課。官方學習頁也標示可免費開始學習、觀看課程影片;若需要 graded assignments 與證書,則屬於 PRO 方案。
吳恩達是誰?為什麼他的新課值得關注?
吳恩達是全球知名的 AI 教育者與機器學習專家。他是 DeepLearning.AI 創辦人、Coursera 共同創辦人,也曾擔任百度首席科學家,並曾創辦與領導 Google Brain 專案,目前也是史丹佛大學兼任教授。
對非工程背景的上班族來說,吳恩達最重要的影響,是他長期把 AI 知識轉化成大眾可以理解、可以上手的學習內容。從早期的機器學習課程,到《AI For Everyone》,再到這次的《AI Prompting for Everyone》,他的課程常被視為 AI 學習趨勢的風向球。
這門課在教什麼?不是背 Prompt,而是學會和 AI 協作
《AI Prompting for Everyone》的核心,不只是教你寫出更漂亮的提示詞,而是教你在不同工作情境中,如何讓 AI 產出更可靠、更有用的結果。官方課程頁將學習重點分成三大方向:找資訊、腦力激盪與寫作、創作與建構。
第一個重點是 Finding Information,也就是用 AI 找資料。課程會說明 AI 模型本身已經知道什麼、什麼時候應該使用 AI 網路搜尋、什麼情境適合使用 deep research mode,以及如何取得更準確、有來源的回答。
這對上班族非常實用。無論是做市場資料整理、競品分析、產業趨勢觀察,或準備會議前的背景研究,AI 不只是回答問題的工具,更可以協助快速建立資料架構。但前提是使用者要懂得要求來源、設定範圍,也要知道哪些資訊需要再查證。
第二個重點是 AI as a Thought Partner,也就是把 AI 當成思考夥伴。課程會教使用者如何提供正確上下文,讓 AI 理解真正需求;也會談到如何讓 AI 提供誠實回饋,而不是只迎合使用者。官方課綱中也列出 brainstorming、context、reasoning、sycophancy、writing with AI、AI critique 等單元。
這代表未來職場的 AI 能力,不只是「會叫 AI 寫東西」,而是能不能請 AI 幫忙檢查盲點、提出反方觀點、改善表達方式,甚至協助自己做更完整的決策思考。
第三個重點是 Working with Multimedia and Code。課程會介紹如何在提示中使用圖片、讓 AI 理解圖片、生成視覺內容,並使用 AI 建立簡單遊戲、網站與 App;官方也特別說明,這部分不需要程式經驗。
這也反映 AI 工具的使用場景正在擴大。過去上班族多半把 AI 用在寫信、摘要、翻譯、整理資料;但未來,AI 也可能協助做簡報素材、產出視覺概念、分析資料,甚至建立可展示的簡易 prototype。
誰適合上這門課?
官方課程頁指出,這門課適合任何在日常工作或生活中使用 ChatGPT、Claude、Gemini 等 AI 工具,並希望獲得更好結果的人,不需要技術背景,也沒有必修前置課程。
換句話說,這門課很適合以下幾類上班族:經常需要查資料的企劃、行銷、編輯、研究人員;需要寫報告、簡報、Email 的一般辦公室工作者;想把 AI 帶進工作流程的主管;以及想開始學 AI、但不想一開始就碰程式的人。
對職場工作者的啟示:提示力已經變成基本功
這門課最值得注意的訊號是:AI 提示力正在從「技巧」變成「基本工作能力」。
過去,很多人學 AI 會先找提示詞模板,例如「請扮演某某角色」、「請一步一步思考」、「請用表格整理」。這些技巧仍然有用,但已經不夠。真正會用 AI 的人,還要知道如何提供背景資料、設定輸出格式、要求資料來源、讓 AI 挑戰自己的想法,並判斷哪些內容可以採用、哪些內容必須查證。
也就是說,未來職場上的 AI 能力,不是誰背了最多 prompt,而是誰更會設計任務、拆解問題、提供上下文,並把 AI 產出整合成真正能交付的工作成果。
有興趣的讀者可至 DeepLearning.AI 官方課程頁開始學習:《AI Prompting for Everyone》。
課程影片可免費開始觀看;若想取得作業評分與證書,需留意官方 PRO 方案說明。
DeepLearning.AI《AI Prompting for Everyone》
看更多
0 0 109 0
選書精靈

小編

2021/10/15

新手學 JavaXAndroid 應用程式開發
書名:Java SE 11與Android 9.x程式設計範例教本
作者:陳會安
Android應用程式開發是目前當紅的軟體開發領域,對於不熟悉Java語言和Android Studio的讀者,本書提供完整Java程式語言與物件導向教學,直接使用筆者開發的輕量級fChart程式碼編輯器幫助讀者學習Java語言和物件導向程式設計後,才真正開始使用Android Studio整合開發環境進入Android應用程式開發,讓讀者從基礎Java語言開始來深入學習Android平台程式設計。本書不只可以作為大專院校的第一門程式語言課程教材(取代傳統Swing或AWT的Java語言),更可以讓初學程式設計者輕鬆進入當紅的Android應用程式開發。
目錄
PART 1 Java 結構化程式設計
ch01 程式與程式邏輯的基礎
ch02 建立 Java 用程式
ch03 變數、資料型態與運算子
ch04 流程控制結構
ch05 類別方法
ch06 陣列與字串
PART 2 Java 物件導向程式設計
ch07 類別與物件
ch08 繼承、抽象類別與介面
ch09 巢狀類別、多型與套件
ch10 例外處理、執行緒、集合物件與 Lambda 運算式
PART 3 Android App 行動應用程式開發
ch11 Android 與 XML 的基礎
ch12 版面配置與使用介面元件
ch13 活動與事件處理
ch14 意圖與意圖篩選
ch15 動作列、對話方塊與清單介面
ch16 偏好設定、檔案與 SQLite 資料庫
ch17 內容提供者、廣播接收器與通知
cha18 繪圖、多媒體與定位服務
看更多
0 0 582 0
你可能感興趣的教室