104學習精靈

前端框架開發

前端框架開發
關注
邀請朋友
邀請朋友

Line

Facebook

複製連結

取消
關於教室
關注人數 0 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
關於教室
關注人數 0 人
104人力銀行從職缺中挑選出常見技能所成立的官方教室,提供大家進行共學互動。
學習主持人
持續分享知識,
有機會成為官方教室主持人
教室標籤
Hi~ 歡迎分享學習資源,有學習問題可匿名向Giver發問!
我要分享
我要提問

前端框架開發 學習推薦

全部
影片
文章
Mike Ku

Learn Code With Mike品牌創辦人

2022/01/15

掌握Scrapy框架重要的CSS定位元素方法(下)
Q: Scrapy如何利用CSS方法取得子元素值?
在實務上利用Scrapy框架開發Python網頁爬蟲時,並不是每次想要爬取的網頁元素(Element)都會有CSS樣式類別可以定位,這時候,就會需要透過上層的父元素往下定位子元素。
假設INSIDE硬塞的網路趨勢觀察網站-AI新聞( https://www.inside.com.tw/tag/ai )的文章標題<a>標籤沒有「js-auto_break_title」CSS樣式類別,而想要爬取<a>標籤的文字內容,該如何達成呢?
這時候,就會需要在Scrapy框架中利用CSS樣式類別先定位到<h3>標籤,接著,再取得其下的子元素<a>標籤,如下範例:
import scrapy
class InsideSpider(scrapy.Spider):
name = 'inside'
allowed_domains = ['www.inside.com.tw']
def parse(self, response):
titles = response.css("h3.post_title a::text").getall()
for title in titles:
print(title)
在範例中,利用「post_title」CSS樣式類別定位到<h3>標籤後,接著一個空白,加上<a>標籤,意思就是取得<h3>標籤下的所有<a>標籤,由於要取得其中的文字,所以加上「::text」。
Q: Scrapy如何利用CSS方法取得元素屬性值?
此外,在開發Python網頁爬蟲時,也有機會爬取元素的屬性值(Attribute),舉例來說,最常見的就是<a>標籤的href屬性值(Attribute),也就是文章的連結網址,這時候只需要將「::text」關鍵字,修改為「::attr(屬性名稱)」即可,如下範例:
import scrapy
class InsideSpider(scrapy.Spider):
name = 'inside'
allowed_domains = ['www.inside.com.tw']
def parse(self, response):
urls = response.css("a.js-auto_break_title::attr(href)").getall()
for url in urls:
print(url)
本文與掌握Scrapy框架重要的CSS定位元素方法(上)搭配實際的網站,示範Scrapy框架利用css()方法(Method)來定位網頁元素的基本用法,重點摘要如下:
1.取得單一元素值呼叫get()方法(Method)
2.取得多個元素值呼叫getall()方法(Method)
3.取得文字內容,加上「::text」關鍵字
4.取得屬性值則加上「::attr(屬性名稱)」關鍵字
希望對於想要學習Scrapy框架的朋友有所幫助。
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/01/scrapy-css-selectors.html
)網站觀看更多精彩內容。
2 0 367 0

熱門精選

104學習精靈

產品

1小時前

【免費報名 | 線上直播】加薪升遷你該這麼做,8年6次升遷經驗大公開 |人才邦 x 104學習精靈
🔥 考績不如預期?
🔥 升遷總是沒你的份?
🔥 2025年該怎麼幫自己職場跟薪資翻身呢?
你的年度考績剛出爐,結果卻不如預期?努力工作,卻總是錯過升遷機會?
如果你希望 今年內成功加薪、突破升遷瓶頸,這場直播就是你的職場必修課!
📅日期:2025/3/19(三)
⏰時間:20:00 - 21:30(1 小時內容 + 30 分鐘 Q&A)
本次講座,人才邦與104學習精靈合作,由 人才邦創辦人 洪偉騰(Henry)與104會員分享。他擁有 8 年 6 次升遷的實戰經驗,在7000人的跨國公司,從基層工程師一路晉升至管理層,成功翻轉職涯,之後自行創業。他將親自分享 如何讓主管「主動幫你升遷與加薪」的關鍵策略,讓你在 2025 年職場競爭中脫穎而出!
💡 這場直播,你將學到:
✅ 明明很努力,為何考績會不佳? 掌握「提升職場評價」的方法,讓主管看到你!
✅ 為什麼升遷總是輪不到你? 深入解析主管評估標準,讓你突破職場隱形天花板!
✅ 如何在 6 個月內創造升遷機會? 讓主管「不升你不行」的 3 大策略!
✅ 如何談加薪,才不會被拒絕? 精準說服技巧,讓加薪變得水到渠成!
✅ 職場成功範例分享!8年六次升遷的實戰經驗分享
✅ 限時專屬優惠!🎁
💡本次活動適合對象:
⚡ 考績不如預期,想知道如何提高未來升遷與加薪空間
⚡ 在公司努力多年,卻始終沒有升遷機會,想突破職場瓶頸
⚡ 2025 年想成功加薪或升遷,但不確定應該如何準備
⚡ 正在考慮轉職,但想在離開前爭取更好薪資或職位
💡 講師介紹:
講師:洪偉騰(Henry)人才邦創辦人
講師經驗:
🔥 曾任趨勢科技(Trend Micro)多項管理職,8 年內獲得 6 次升遷,在7000人的跨國企業中,從基層工程師一路晉升至研發經理、專案經理、業務經理、Technical PMM等職位。曾負責年營收30億台幣的產品專案。
🔥 2015年起推動【職場沒人教的事】,至今即將滿十周年,幫助上千名學員成功突破職場瓶頸,達成 15-30% 加薪 或 晉升管理職
🔥《加薪升遷必勝技》線上課程講師,學員實證有效的職涯提升方法
🔥 另一身分為商業顧問,協助企業營收成長。企業客戶公司年度業績YOY達 340%。
🔥交大台北校友會候補理事。
1 0 63 0
104學習精靈精選課程
看更多課程
想提升職場競爭力?專業技能課程看起來👇
Mike Ku

Learn Code With Mike品牌創辦人

2022/01/15

掌握Scrapy框架重要的CSS定位元素方法(上)
想要開發Python網頁爬蟲的朋友,都會知道定位元素(Element)是一個非常重要的動作,Scrapy框架本身就有提供自己的定位元素(Element)方法(Method),包含CSS與XPath兩種,本文就以INSIDE硬塞的網路趨勢觀察網站-AI新聞( https://www.inside.com.tw/tag/ai )為例,先來和大家分享在Scrapy框架中,如何利用CSS的定位元素(Element)方法(Method),爬取想要的網頁內容。
Q: Scrapy如何利用CSS方法取得單一元素值?
CSS(Cascading Style Sheets)階層樣式表相信大家都不陌生,可以自訂樣式的類別來裝飾網頁,像是字體顏色、粗體等,所以在利用Scrapy框架開發網頁爬蟲時,也就能夠利用CSS樣式類別,來定位想要爬取的網頁元素(Element)。
前往INSIDE硬塞的網路趨勢觀察網站-AI新聞,在文章標題的地方,點擊滑鼠右鍵,選擇檢查,可以看到它的CSS樣式類別。假設想要在Scrapy框架中,利用CSS樣式類別來取得網頁的單一元素值,也就是單一文章的標題,就可以在spiders/inside.py的parse()方法(Method)中,使用css()方法(Method)來定位單一元素(Element),如下範例:
import scrapy
class InsideSpider(scrapy.Spider):
name = 'inside'
allowed_domains = ['www.inside.com.tw']
def parse(self, response):
title = response.css("a.js-auto_break_title::text").get()
print(title)
接著,利用以下的指令執行inside網頁爬蟲:
$ scrapy crawl inside
以上範例,response就是Scrapy框架請求後的回應結果,接著,呼叫css()方法,傳入所要定位的HTML標籤<a>,點的後面加上它的CSS樣式類別,由於要取得元素(Element)的文字,所以在加上「::text」關鍵字,最後,呼get()方法(Method)取得單一元素(Element)。
Q: Scrapy如何利用CSS方法取得多個元素值?
而在Scrapy框架中,想要爬取網頁多個元素值,則呼叫getall()方法(Method)即可,如下範例:
import scrapy
class InsideSpider(scrapy.Spider):
name = 'inside'
allowed_domains = ['www.inside.com.tw']
def parse(self, response):
titles = response.css("a.js-auto_break_title::text").getall()
print(titles)
可以看到getall()方法(Method)回傳的是一個串列(List),包含了所有樣式類別為「js-auto_break_title」的<a>標籤文字,接下來,利用迴圈即可取得其中的文章標題,如下範例:
import scrapy
class InsideSpider(scrapy.Spider):
name = 'inside'
allowed_domains = ['www.inside.com.tw']
def parse(self, response):
titles = response.css("a.js-auto_break_title::text").getall()
for title in titles:
print(title)
如果想要學習更多的Python應用教學,歡迎前往Learn Code With Mike( https://www.learncodewithmike.com/2021/01/scrapy-css-selectors.html
)網站觀看更多精彩內容。
2 0 180 0

推薦給你

104學習精靈

產品

03/03 09:34

【最新】2025年2月職場熱搜證照排行榜公開,新進榜證照有哪些?
透過從104人力銀行中「找工作」與「自我學習」的大數據,整理出大家都在搜尋的TOP 10 熱門證照;本篇主要是針對所有104證照的熱搜綜合排行榜,本月有很多新進榜的證照快來看 !
第1名 🟡 圖像生成課程認證 🔺新進榜
線上課程約8小時 本課程將介紹擴散模型,這是一種機器學習模型,近期在圖像生成領域展現亮眼潛力。
發行單位: Google
第2名 🟡公共工程品質管理人員
本證照之目的主要是為了提升工程品質管理之觀念,建立工程品質管理系統、預防工程缺失之發生及提昇公共工程施工品質,屬於工程從業人員品質管理....
第3名 🟡 丙級會計事務技術士
學科測驗包括會計事務之基本知識;術科測驗包括編製傳票、 記帳及編表等帳務實...
第4名 🟡 丙級中餐(葷食)烹調技術士
丙級廚師執照,是初級的證照,只要菜色符合就可以通過,不需要經過嚴格的味道評分...
第5名 🟡 大型語言模型(LLM)課程認證 🔺新進榜
線上課程約8小時 這堂入門微學習課程說明大型語言模型 (LLM) 的定義與用途,以及如何調整提示來提高 LLM 成效。這堂課程也會介紹多項 Google 工具,協助您自行開發生成式 AI 應用程式。 完成此活動,贏取徽章!
第6名 🟡 國際貿易大會考 🔺新進榜
為增進國內貿易從業人員及一般大眾對國際貿易專業知識之瞭解,並利於貿易人才之聘用,...
第7名 🟡 TOEIC (多益測驗)
多益測驗乃針對英語非母語人士所設計之英語能力測驗,測驗分數反映受測者在國際職場環境中與....
✅ 多益線上模擬試題練習 (前進外商必備能力)
✅ NEW TOEIC 新多益線上高分速成班
第8名 🟡工地主任
依據營造業法相關規定,營造業工程從業人員需依法取得工地主任執業證及合法執業營運,以確保營造工程之品質....
第9名 🟡 堆高機操作技術士
證照發行單位: 勞動部勞動力發展署技能檢定中心https://nabi.104.com.tw/certify/unit/d0a2b240-e759-4286-967b-cacf03d331cc
113年考古試題及答案:https://nabi.104.com.tw/ability/10028900
第10名 🟡乙級職業安全衛生管理員
乙級職業安全衛生管理員是一項專業證照,通常涉及在工作場所中負責安全衛生管理的人員。持有這張證照的人通常具備相應的專業知識和技能....
--------------------
不同的職務有不同的證照需求,你可以透過【104學習精靈】探索你現在的職務或是針對你感興趣的職務進行探索,找到你的關鍵職能,增加職涯的競爭力。
0 0 2862 0
你可能感興趣的教室