成為 AI 科學家|網路爬蟲大師教你快速完成資料擷取

課程資訊 課程大綱 開課單位 常見問答
Loading...
線上課程

成為 AI 科學家|網路爬蟲大師教你快速完成資料擷取

2922次瀏覽
NT$1,790
優惠現領
85 折
【4/9-5/5限時85折】
課程資訊
本頁面課程內容及活動資訊概由廠商提供,部分內容非屬104服務範疇,會員應遵守之規範悉依 104課程中心會員規約 所載。
上課時間 無限期觀看課程查看更多
上課方式 於開課單位網站兌換後觀看課程
課程內容
課程大綱
展開全部
1 認識爬蟲及 HTML
01
什麼是爬蟲
02
QUIZ:什麼是爬蟲
03
HTML 結構介紹
04
QUIZ:HTML 結構介紹
05
常見標籤介紹
06
QUIZ:常見標籤介紹
07
QUIZ:認識爬蟲及 HTML
2 URL 網址解析
01
URL 結構介紹
02
QUIZ:URL 結構介紹
03
URL 參數使用
04
QUIZ:URL 參數使用
05
實作 - 以 Google Search 為例
06
QUIZ:實作 - 以 Google Search 為例
3 HTTP METHOD
01
GET 和 POST 介紹
02
QUIZ:GET 和 POST 介紹
03
GET 操作及範例
04
QUIZ:GET 操作及範例
05
POST 操作及範例
06
QUIZ:POST 操作及範例
4 開發人員工具 (Chrome Developer Tool)
01
開發人員工具介紹
02
QUIZ:開發人員工具介紹
03
Element 功能介紹
04
QUIZ:Element 功能介紹
05
Network 功能介紹(上)
06
Network 功能介紹(下)
07
QUIZ:Network 功能介紹
5 網頁撰寫及 CSS
01
撰寫簡易 HTML
02
<table> 表格操作
03
<form> 表單操作
04
表單其他操作
05
CSS 介紹及操作
06
CSS 模板介紹及使用
07
QUIZ:網頁撰寫及 CSS
6 JSON
01
JSON 資料結構介紹
02
QUIZ:JSON 資料結構介紹
03
JSON 與一般 DataFrame 比較
04
QUIZ:JSON 與一般 DataFrame 比較
05
什麼是動態網頁
06
QUIZ:什麼是動態網頁
7 認識爬蟲套件及環境建置
01
Python 爬蟲環境建置
02
內建套件 urllib 介紹
03
第三方套件 resuests 介紹及安裝
04
第三方套件 BeautifulSoup 介紹及安裝
05
QUIZ:認識爬蟲套件及環境建置
8 萃取網頁內容(GET)
01
urllib 及 requests 操作比較
02
QUIZ:urllib 及 requests 操作比較
03
認識 headers
04
QUIZ:認識 headers
05
BeautifulSoup 操作
06
QUIZ:BeautifulSoup 操作
9 處理 HTML
01
BeautifulSoup find() 及 findAll() 操作
02
BeautifulSoup select_one() 及 select() 操作
03
以 select() 為例操作回傳值
04
QUIZ:處理 HTML
10 爬蟲實作
01
實作 - 以 PTT 電影版為例 - 文章列表
02
實作 - 以 PTT 電影版為例 - 多頁爬取
03
實作 - 以 PTT 電影版為例 - 儲存內文
04
QUIZ:爬蟲實作
11 萃取網頁內容(POST)
01
如何使用 POST 方式進行請求
02
QUIZ:如何使用 POST 方式進行請求
03
如何取得 Hidden value
04
QUIZ:如何取得 Hidden value
05
實作 - 以政府採購網為例
06
QUIZ:實作 - 以政府採購網為例
12 cookies 及 session
01
認識 cookies 及操作
02
QUIZ:認識 cookies 及操作
03
認識 session 及操作
04
QUIZ:認識 session 及操作
05
實作 - 以 PTT 八卦版為例
06
QUIZ:實作 - 以 PTT 八卦版為例
13 動態網頁 - 瀏覽網頁過程產生新內容
01
動態網頁產生新內容的原理
02
QUIZ:動態網頁產生新內容的原理
03
擷取新產生內容(Json)
04
QUIZ:擷取新產生內容(Json)
05
json 套件操作
06
QUIZ:json 套件操作
14 JSON 操作結合爬蟲套件
01
出現 json 的網頁類型介紹
02
實作 - Dcard 網站爬蟲擷取圖片
03
QUIZ:實作 - Dcard 網站爬蟲擷取圖片
04
實作 - TechOrange 網站爬蟲
15 資料整理 - jieba 斷詞
01
jieba 斷詞套件介紹及安裝
02
jieba 套件基本斷詞操作
03
自定義詞典介紹及操作
04
將自定義詞典套用到前面的程式
05
停用字詞典
06
QUIZ:資料整理 - jieba 斷詞
16 資料整理 - pandas - 1
01
pandas 套件介紹及安裝
02
QUIZ: pandas 套件介紹及安裝
03
DataFrame 概念講解
04
QUIZ:DataFrame 概念講解
05
Seris 概念講解
06
QUIZ:Seris 概念講解
07
QUIZ:資料整理 - pandas - 1
17 資料整理 - pandas - 2
01
將文字檔資料整理為 DataFrame
02
過濾器使用
03
將 DataFrame 存成 CSV 檔
04
讀取 CSV 檔
05
QUIZ:資料整理 - pandas - 2
18 Selenium 及 Chrome driver
01
Selenium 套件介紹及環境建置
02
QUIZ:Selenium 套件介紹及環境建置
03
實作 - 瀏覽 PTT 八卦版
04
QUIZ:實作 - 瀏覽 PTT 八卦版
05
實作 - 爬取動態網頁
06
QUIZ:實作 - 爬取動態網頁
你可以學到


  透過程式在網站上「自動化」抓取資料

讓你身在大量數據時代下,依然可以快速且準確找到自己所需的資料,不只侷限在工作上,也可以應用到「新聞」、「論壇」、「股票資訊」......等,不必再面對無限重複的資訊複製和張貼,快速地將動、靜態各種類型網站一次爬好爬滿 工作與生活應用一次滿足、效率 Level Up、快速掌握所需資料若想獲得更多爬蟲相關知識,歡迎參考 了解網路爬蟲的 9 個工作流程

  學習網路爬蟲時總會碰到的痛點

僅管網路上已經擁有非常多關於「網路爬蟲」的教學資源,但我們發現很多人在學習過程中總會遇到很多不同的問題,若以下這些也正是你學習時遭遇的挫折,你將能在這門課獲得幫助!



  課程包含 5 份實作案例
藉由經驗的升等,就算身在資訊爆炸的網路世界裡,也不怕被海量數據淹沒,可輕鬆快速抓取你想要的資料



適合對象
  • 具備 Python 程式基礎能力,想要培養 AI / 資料科學實作能力的你
  • 想轉往 AI 工程師 / 資料工程師 / 數據工程師 / AI 科學家發展的你
  • 需要擷取與儲存大量網頁資料,想要有更快速方法的你
  • 不論具備什麼背景,只要對蒐集資料數據有興趣的你
課程講師
施丞優
經歷|▹ TibaMe AI/Big Data 資料分析師養成班爬蟲課程專業講師▹ 現任新創軟體公司資深資料工程師▹ 曾任金融業大數據分析部門資料工程師養成班學員一致認同,屢屢獲得高評點、高滿意度的人氣講師專案|▹ 人力銀行職缺技能分佈報表▹ 自動化爬蟲 ETL 介面規劃專長|▹ 軟體後端分散式運算▹ 後端 API▹ 網路爬蟲 ETL
展開全部
開課單位
緯育TibaMe
緯育TibaMe由全球最大資通訊集團之一的緯創資通集團於2015年正式成立,我們專注於人才培訓與平台服務,發展多元的授課模式,並結合緯育開發的雲端智能化學習系統,有效培育新世代數位化人才。在行動與雲端時代,用科技加值人才培育,持續發展創新與有效的數位教育學習服務。
最新動態 看所有動態

從想轉職到成功轉職-學長姊現身說最真實

🎤 #學長姊分享 想跨域轉職一路上的 ✅ 心態調適 ✅ 準備過程 ✅ 成功經驗 ✅ 職場真實樣貌,聽我們說不如聽過來人──轉職成功的學長姊現身說最真實~ 這裡報名線上與學長聊聊>> https://bit.ly/4ijQMKh ▍誰適合參加 🔹即將從就業培訓班結訓的你 🔹剛結訓想繼續物色優質職缺的你 🔹想跨域域轉職猶豫中的你 ▍從財金系畢業轉職為後端工程師的學長要跟你分享 🔥 如何結合非本科系的背景創造自己的優勢 🔥 專題作品準備心法 🔥 履歷撰寫技巧與面試準備方向 🔥 進入職場的實際狀況與持續進修該學什麼 🔥 後端工程師未來職涯發展的可能性 ▍直播資訊 時間:4/23 (三) 晚上 8 點至 9 點 型式:線上直播 (直播連結將於報名後2~3個工作天email提供) 報名連結: https://bit.ly/4ijQMKh

AI × Python × 商務應用開發,跨域實戰訓練開放報名!

📢 AI × Python × 商務應用開發,跨域實戰訓練開放報名! 還在等自學開竅?與其被AI浪潮甩在後頭,不如現在就開始打好根基,從AI開發到商務應用一次搞定! 🔥 【商務AI應用人才養成班】第01期 即日起開放報名 系統化訓練從 Python、ChatGPT、LINE Bot、LLM 到雲端部署與專案實戰, 讓你不只能寫程式,還能部署應用、主導AI專案! 📍 上課地點:台北市中山區/部分遠距授課 📆 上課時間:2025/5/27~2025/8/28(共322小時) 🧠 甄試日期:2025/5/15(含 Python 筆試與口試) 💰 訓練費用:勞動部補助 💡 你將學到: Python 程式設計 × 雲端資料處理 × ChatGPT × Gradio × LINE Bot × Azure AI × Docker × LLM 整合應用 AI 協助簡報設計、圖像生成、影片剪輯等商務應用 NLP開發、AI前端、專題實作、專案管理與求職技巧 🎯 就業發展方向: AI應用工程師、提示詞工程師、產品專案經理、Pre-Sales 工程師、商務開發等 課程說明會: https://www.surveycake.com/s/46o6g 課程頁面>> https://www.tibame.com/goodjob/AItalent
常見問答
如何購買課程並開始上課
於欲購買 1. 線上課程之頁面,點擊「立即購買」,成功使用信用卡完成付款並確立訂單成立後,本平台將透過購買填寫之信箱,以郵件方式通知「訂單成立」,後續兌換學習有兩種形式:(A) 若購買學習廠商提供課程,購買後「提供課程兌換序號、兌換連結、兌換碼使用說明」,引導您至購買課程之出版廠商兌換並上課、(B)若購買是104學習系統,購買完可以從郵件、訂單明細、課程詳細頁直接進到站內線上學習。 2. 實體課程之頁面,點擊「立即購買」,成功完成付款並確立訂單成立後,本平台將透過購買填寫之信箱,以郵件方式通知「訂單成立」即可完成報名,後續開課單位會有專員與您聯繫後續事宜。
購買與報名課程付款方式?
僅提供信用卡付款。
有支援信用卡分期嗎?
平台有提供分期服務:結帳金額滿$4,000可享三期零利率,滿$12,000可享六期零利率;分期服務支援銀行公司為:中國信託、台新銀行、玉山銀行,實際分期金額依各發卡行規定
已完成付款,但用錯折扣碼怎麼辦?
請申請退款並重新下單,已使用之折扣碼,本平台將不進行退回,敬請見諒。
線上刷卡後訂單狀態顯示「待付款」
代表您的結帳流程尚未完成,請儘速完成結帳程序,以免課程相關優惠權益失效。
刷卡失敗的原因
可能為以下原因: 1.授權失敗(例:信用卡發卡銀行系統忙碌、網路塞車、刷卡等待時間過久造成系統確認失敗等問題),建議稍待一段時間再重新刷卡。 2.輸入信用卡卡號等相關資料不正確(例:輸入資料不正確、卡號過期、尚未開卡等問題),建議重新確認輸入資訊。
如何選擇紙本發票
為響應政府政策,不主動提供紙本發票,委由金財通系統寄發電子發票開立通知信至學員購買課程時填寫之Email,發票自動存入會員載具,若未收到請告知。
企業請款之憑證,如何申請
若需要進行企業請款,請於購買時輸入統一編號、發票抬頭,本平台將以郵件寄送電子發票方式,至您填寫之信箱。
多久會收到發票
發票將於付款成功,3個工作天內開立,敬請稍候。
如何退款
請參考下方退款須知與流程 1.若您於本平台成功完成付款購買課程,有退款需求,於外部學習廠商兌換之線上課程自購買日起7天內,且未進行課程兌換,可申請全額退費;於104課程中心站內學習課程若購買日起7天內後「未進到學習頁」,可申請全額退費;實體課程須於開課日前 1 日之非假日上班時段前與104學習精靈提出申請,始得要求全額退費。 2.若需申請退款,請使用信件主旨:「課程中心退款申請」,並於信件內容寫明購買人姓名、訂單編號、欲退款之課程名稱,郵件至nabiservice@104.com.tw,本平台將於5個工作天內盡快為您處理。 3.確認提出退款申請時間為課程購買日起7天內,且未進行課程兌換,本平台將與欲申請退款課程之出版廠商,提出會員資料與學習紀錄查詢,確認您課程的觀看紀錄,並同步確認出版廠商訂定之退款事項,是否全數符合。申請退款的同時,即代表您同意本平台與退款課程之出版廠商,提出查詢會員資料與學習紀錄。 4.若您單一訂單中購買兩堂(含)以上課程,不需要整張訂單退款(只退其中幾堂課),退款金額為欲退款課程售價加總後,扣除此張訂單所使用之折扣碼(若折扣碼為整張訂單之折數折扣,則退款金額為欲退款課程售價加總後乘以折數折扣),若計算後退款金額低於(含)0元,本平台將不執行退款。5.上述退款方式僅限於本平台成功完成付款購買之課程,若付款與訂單成立之任一程序不在本平台完成,退款方式需依照課程出版之廠商所訂定之規則提出申請,並由課程出版廠商協助處理,本平台不介入。 6.若您的發票沒有填寫統一編號,並需要辦理退款時,由本平台代為處理發票相關作業 (如作廢電子發票或開立電子發票折讓單),以加速退款作業時程。 7.若您原訂單信用卡分期,其申請退費時,須整筆訂單全額退費,無法部分或擇一課程退費。
款項何時退回
課程退費採原信用卡退刷方式,退費所需之工作天依各金融機構實際作業時間為準。