104學習精靈

XML

XML
關注
邀請朋友
邀請朋友

Line

Facebook

複製連結

取消
XML(eXtensible Markup Language,簡稱XML)可擴展置標語言。又稱可擴展標記語言,是一種置標語言。 置標指計算機所能理解的信息符號,通過此種標記,計算機之間可以處理包含各種信息的文章等。如何定義這些標記,既可以選擇國際通用的標記語言,比如HTML,也可以使用像XML這樣由相關人士自由決定的標記語言,這就是語言的可擴展性。 XML是從標準通用置標語言(SGML)中簡化修改出來的。它主要用到的有可擴展置標語言、可擴展樣式語言(XSL)、XBRL和XPath等。 XML設計目的用來傳送及攜帶數據信息,XML不用來表現或展示數據,HTML語言恰恰用來表現數據,所以XML用途的焦點是它說明數據是什麼,以及攜帶數據信息。
關於教室
關注人數 5 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
關於教室
關注人數 5 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
Hi~ 歡迎分享學習資源,有學習問題可匿名向Giver發問!
我要分享
我要提問

XML 學習推薦

全部
影片
文章

不知如何開始嗎? 先進行技能挑戰吧~

技能挑戰:初級
目前等級:未達初級
101 人已通過「初級」測驗,通過率49%,和學習精靈一起探索知識、增強能力!
我要挑戰
Mike Ku

Learn Code With Mike品牌創辦人

2021/10/14

開發Python網頁爬蟲前需要知道的五個基本觀念
Q: 什麼是網頁爬蟲?
網頁爬蟲可以把它想像成是一種網頁機器人,能夠依照特定的模式或規則,自動化擷取網頁原始碼,來進行解析取得資料,所以被大量的應用在網頁資料蒐集。
當然網頁爬蟲部一定只能使用Python來進行實作,其它像Java、C#及JavaScript等程式語言也可以,而因為Python語法簡潔及擁有許多成熟的套件與框架,所以筆者選擇Python來開發網頁爬蟲。
Q: 網路是如何運作方式呢?
Python網頁爬蟲事實上就是模擬使用者來瀏覽網頁,這時候就需要瞭解網路的基本架構,分為用戶端(Client)及伺服端(Server)。
其中,用戶端(Client)就是使用者瀏覽網頁的裝置(例:本機電腦),當使用者點擊網頁時,也就代表請求(Request)的動作,存取該網頁連結的伺服端(Server),而伺服端(Server)接收連結得知使用者所要看的網頁後,將內容回應(Response)給用戶端(Client)。
這樣的網路運作方式就跟點餐的流程非常相似,當我們進到一間餐廳看著菜單,就像到一個網站瀏覽其中的網頁,接著,到櫃檯向老闆點餐的動作就像是看到喜歡的網頁,請求(Request)伺服端(Server)想看的網頁,最後,等待老闆烹飪完成送到餐桌上,像是伺服端(Server)端處理完成回應(Response)給使用者。
Q: 網頁的基本結構是什麼?
網頁是由許多的標籤(Tag)與元素(Elements)組成,並且具有階層式的結構,所以Python網頁爬蟲就需要透過定位,來取得所需的元素(Elements)。
Q: 常見的Python網頁爬蟲套件及框架
常見的Python網頁爬蟲套件及框架包含BeautifulSoup、Selenium及Scrapy。
BeautifulSoup對於HTML及XML的解析非常友善,並且容易入門使用,適用於靜態類型的網頁及小型的Python網頁爬蟲專案。
Selenium同時擁有網頁自動化測試及爬取功能,能夠搭配 JavaScript來進行爬取,所以非常適用於爬取需要滾動捲軸來動態載入資料的網站,像是電子商務或社群平台等。
Scrapy相較於BeautifulSoup及Selenium爬取速度較快且有效率,擁有非同步的功能,所以適用於爬取大量的資料及大型網頁爬蟲專案。
Q: Python網頁爬蟲有沒有標準的開發流程?
開發Python網頁爬蟲的流程,首先,會需要知道想要蒐集什麼樣的資料來進行分析或應用,接著,就可以尋找相關的網站,來分析要爬取的網頁原始碼結構,並且觀察是否有規則或模式可循,然後,選擇程式語言及適當的套件,依照分析的網頁結構及規則開發網頁爬蟲,最後,將爬取的資料依需求寫入資料庫、CSV檔案或雲端等。
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2020/10/python-web-scraping.html )網站觀看更多精彩內容。
2 0 990 1

熱門精選

104學習精靈

產品

11/15 12:57

【最新】2024年11月AI課程熱門排行榜TOP 10:最受歡迎的AI學習課程推薦
從AI基礎知識到應用,市面上提供了各種AI學習課程:AI線上課程、AI實體課程,無論您是初學者還是專業人士,都可以找到適合自己的AI課程。本文將為您揭曉2024年11月最受歡迎的AI課程排行榜,幫助您輕鬆找到優質的AI學習資源,快速掌握AI技能。
本篇透過從104課程中心的用戶學習大數據,整理出大家都在搜尋的TOP 10 熱門課程;可透過排行榜,找到你所需的學習內容,增進職場的職能成長,加強自我競爭力,打造你的職涯藍圖!
第1名。ChatGPT x Excel | 職場必學商務數據分析術
講師將以系統化教學法,教授數據分析常用情境,搭上火紅 ChatGPT ,步驟式實戰,能隨學即用,讓你知道如何在工作中運用所學到的技能!
第2名。AI資料科學家【 聽課全系列 】
「基礎思維」AI資料科學的新朋友,必定要了解一下人工智慧的歷史里程碑與事件,從這裡出發,您也能與不熟悉這個領域的朋友侃侃而談地分享您所學領域的轉變與趨勢,而初學者免不了學習的十字路口,不知道該從哪個部分開始學習AI,這裡也會給您適合適當的指引。常常被混的網頁爬蟲與ETL您真的認識並了解嗎?聽聽看TibaMe的講師們怎麼說吧!
第3名。生成式AI應用速成:商業溝通師-數位行銷課(12/21開課)
🔴報名截止日:2024/12/8🔴
你可以學到
🌟AI 行銷創作零基礎也能秒上手|不需任何行銷經驗,快速學會生成式 AI 工具,輕鬆打造吸睛行銷素材。
🌟行銷策略效果爆發式成長| 有效運用 AI 提升執行力,讓行銷效率飆升、策略效果倍增。
🌟精準鎖定目標受眾,打中痛點| 用 AI 技術解析消費者行為,精準掌握市場趨勢,一次抓住受眾需求。
🌟品牌形象全面升級| AI 創造獨特行銷風格,讓品牌成為目光焦點,迅速在市場中脫穎而出。
第4名。2小時輕鬆學AI | 基礎觀念與應用
從資料科學的基礎觀念談起、商業智慧、資料探勘、影像辨識等技術應用,最後再討論企業實際導入人工智慧所需的相關流程。
第5名。生成式AI應用速成:創作詠唱師-影音創作課(11/30開課)
🔴報名截止日:2024/11/17🔴
你可以學到
🌟虛擬角色打造 | 從角色設計、到AI影片製作,一站式打造你的專屬虛擬網紅。
🌟短影音製作 | 運用AI工具,快速生成各種特效、濾鏡,製作出精緻的短影音。
🌟內容行銷 | 學習如何利用AI工具製作出更能觸動觀眾的內容。
第6名。生成式AI工具應用實戰 (線上直播課程)
你可以學到
行銷廣告文案+社群策略及內容+SEO生成+BingAI繪圖,一次學會生成式AI工具應用!
本課程「生成式AI工具應用」旨在教導學員如何利用最先進的生成式AI工具,特別是ChatGPT和微軟Bing AI繪圖工具,來提升行銷文案、社群媒體內容、SEO優化、廣告文案創作以及內容行銷的效率和成效。
第7名。生成式AI應用速成:創作詠唱師-繪圖設計課(12/21開課)
🔴報名截止日:2024/12/8🔴
你可以學到
🌟成為AI設計高手| 從設計小白變身AI設計達人,自信接下各種設計挑戰。
🌟擴大職涯發展| 掌握AI設計技能,提升職場競爭力,開拓更多職涯發展機會。
🌟節省設計成本| 減少外包設計費用,提高工作效率,為企業創造更多價值。
🌟實現創意無限| 突破傳統設計框架,用AI工具打造出獨一無二的視覺作品。
第8名。AI應用時代|從邏輯思維到文字溝通,從職場複利到高效生活
藉由AI助手的力量,更高效地完成商務工作、激發靈感。也透過AI協助經營社群,包含工作行程、日常旅遊、飲食規劃等,提高短影音規劃的效率,進而產出斜槓複利。
第9名。一次搞懂 ChatGPT 工作法 | 5分鐘看懂,立即上手 AI 應用觀念!
5分鐘輕巧學:圖解式影音 X 25應用情境 X 30組AI神器
第10名。AI x 產品企劃(產品開發)實務應用班
你可以學到
往在產品企劃及開發上,所面臨到的難以解決的疑難問題,在未來都有機會利用AI工具進一步改善,取得更有效的解決方案。
本課程將教會您如何快速掌握AI在商業分析、創意生成、行銷文案、用戶旅程設計與消費者行為洞察中的應用,並了解如何將這些工具應用於產品企劃流程中。
更多AI課程推薦:
2 0 2723 0
學習精靈

07/19 00:00

98 4
Mike Ku

Learn Code With Mike品牌創辦人

2021/10/13

三大Python網頁爬蟲實作工具的比較
Q: Python有哪些常見的網頁爬蟲工具呢?
要實作Python網頁爬蟲,最受歡迎的三大工具莫過於BeautifulSoup、Selenium及Scrapy,其中各自的主要特色以及使用時機,接下來就來為大家進行簡單的分享與比較。
BeautifulSoup是一個擷取HTML/XML內容的套件,提供了非常多友善的方法(Method),協助開發人員可以快速搜尋及取得HTML/XML中的元素,也因此被廣泛的應用在Python網頁爬蟲的技術上。
但是它並無法單獨完整實現Python網頁爬蟲的整個流程,像是發送請求與解析下載的HTML原始碼,所以需要requests及html.parser或lxml解析器等相依性模組來協助。
Selenium是一個網頁自動化測試的套件,擁有許多網頁操作的方法(Method),像是自動化輸入資料、點擊按鈕及滾動捲軸等,同時具備網頁元素擷取與操作的功能,讓開發人員能夠輕鬆撰寫網頁的自動化測試腳本。
Scrapy本身就是一個網頁爬蟲框架,提供完整的網頁爬蟲開發功能,像是發送請求、檔案匯出、例外處理機制、偵錯(Debug)等,並且是基於Twisted非同步網路框架所建立的,所以能夠非同步的發送請求(Request),有較佳的執行速度,學習曲線也較高。
另外,由於Scrapy是一個框架,所以有一定的專案架構及執行流程,除了未來很好維護外,也能夠輕鬆的移轉既有的專案到另一個專案。
Q: BeautifulSoup、Selenium及Scrapy各有什特色?
BeautifulSoup學習曲線較低,非常容易上手,並且適用於靜態網頁的爬取。
而Selenium能夠輕鬆與JavaScript的事件合作,可以處理網頁的AJAX請求及自動化操作網頁上的元素。
Scrapy執行速度較快,允許客製化功能來進行擴充,內建多種檔案格式輸出(JSON、XML、CSV),支援XPath及CSS表達式來擷取資料,擁有完善的互動式偵錯工具(Scrapy Shell)。
Q: BeautifulSoup、Selenium及Scrapy的使用時機?
對於初學者想要學習入門Python網頁爬蟲,或是僅針對特定少數網頁進行爬取的小型專案,就可以選擇BeautifulSoup套件。
當所要爬取的網頁有使用JavaScript / AJAX等動態載入資料的技術,或是具有登入驗證、搜尋機制的網頁,就能夠利用Selenium套件的網頁操作方法(Method),來開發Python網頁爬蟲。
Scrapy則適用於大型的Python網頁爬蟲專案,有一定的效率要求及需要處理複雜的爬取邏輯。
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2020/11/beautifulsoup-vs-selenium-vs-scrapy-for-python-web-scraping.html )網站觀看更多精彩內容。
4 0 745 1
學習精靈

07/02 00:00

36 0

推薦給你

知識貓星球

喵星人

6小時前

感恩節的由來和活動!認識西方的重要節日!
2024感恩節(Thanksgiving)在11月28日,這是西方(尤其是美國和加拿大)文化中最具代表性的節日之一,通常在美國於每年十一月的第四個星期四慶祝,在加拿大則是十月的第二個星期一。感恩節的由來可追溯到1621年,當時清教徒和原住民共同舉行豐收慶典,為了感謝一年的收成。本篇文章介紹感恩節相關的活動和英文單字,還有馬西百貨的感恩節盛大遊行介紹,一起來看看吧!
▍感恩節活動
1. Eating Turkey 吃火雞
⇨ 火雞是感恩節晚餐的傳統主菜,雖然沒有明確的文獻說明,但推測是當時清教徒居住的北美洲東北部地區有大量的野生火雞,也因此成為食物來源。
• 例句:On Thanksgiving, we always have roasted turkey with cranberry sauce.
在感恩節,我們總是吃烤火雞搭配蔓越莓醬。
2. Family Gathering 家庭聚餐
⇨ 感恩節的精神在於感謝生命中的人事物,家人會聚在一起分享晚餐並表達感謝。
• 例句:Thanksgiving is the perfect time for a family gathering.
感恩節是家人團聚的最佳時機。
3. 觀看美式足球比賽 (Watching Football Games)
⇨ 許多人會在感恩節觀看美式足球比賽,美式足球在感恩節的歷史可以追溯到1876年,當時耶魯大學和普林斯頓大學在感恩節當天舉行了一場比賽,吸引了眾多觀眾。隨後,美式足球逐漸與這個節日緊密相連。NFL(美國國家橄欖球聯盟)自1934年起開始在感恩節安排比賽,這項傳統一直延續至今。
• 例句:My dad loves watching football games on Thanksgiving Day.
我爸爸喜歡在感恩節那天看美式足球比賽。
4. Parades 遊行活動
⇨ 馬西百貨公司感恩節遊行(Macy’s Thanksgiving Day Parade)是美國感恩節最具象徵意義的慶祝活動之一。該遊行始於1924年,最初是為了吸引顧客並慶祝感恩節,此後,遊行便成為每年感恩節上午在紐約市舉行的傳統盛事,當天會吸引數百萬現場觀眾以及透過電視和網路收看的全球觀眾。
• 例句:The Macy’s Thanksgiving Day Parade is broadcast nationwide every year.
馬西百貨公司的感恩節遊行每年都全國直播。
▍感恩節單字 Thanksgiving Vocabulary
1. Gratitude 感恩
⇨ 表達對事物或他人的感謝。
• 例句:We should express our gratitude to those who help us.
我們應該對幫助我們的人表達感謝。
2. Stuffing 填料
⇨ 填充在火雞中的麵包屑或其他食材。
• 例句:The turkey stuffing is made with bread, onions, and herbs.
火雞填料是用麵包、洋蔥和香草製作的。
3. Pumpkin Pie 南瓜派
⇨ 一種常見的感恩節甜點。
• 例句:Grandma makes the best pumpkin pie for Thanksgiving.
奶奶做的南瓜派是感恩節最棒的。
4. Harvest 豐收
⇨ 感恩節的核心概念之一是慶祝豐收。
• 例句:Thanksgiving was originally a celebration of the harvest season.
感恩節最初是慶祝豐收季節的節日。
5. Cornucopia 豐饒角
⇨ 一種象徵豐饒的裝飾品,通常用於感恩節。
• 例句:The cornucopia on the table symbolizes abundance and gratitude.
桌上的豐饒角象徵著富足和感恩。
你對於感恩節哪個活動最感興趣呢?小編是馬西百貨的感恩節遊行!雖然無法遠渡至紐約觀看遊行,但仍然能透過轉播參與盛事,一起相約在11月28日 線上觀看感恩節遊行吧!附上連結給有興趣的讀者!
0 0 30 0
你可能感興趣的教室