Learn with Shin

程式語言 (C/Python)、SSE Python程式語言國際認證、CLPython、scrum產品管理、ActivePython、Collections、IPython、blockchain、Scrum、pathlib、Python 3、網頁資料擷取與分析 Python、Python、Scrum產品開發、NumPy

HsuShin

2022/05/29

如何利用Python處理PDF

今天要跟大家一起看一下工作或生活中都常常會接觸到的 -- PDF檔案。
PDF(全名Portable Document Format)的檔案中除了文字以外,可以有圖片,表格,甚至是動畫 -- 相當的賞心悅目。除了方便在網路上傳送,經常看到譬如說個人履歷表、銀行交易紀錄、公司財務報表、海報、廣告文案等等頃向會印出來的文件也都會使用PDF。
只是,美麗的東西往往都是帶刺的🌹。這些豐富的要素,使得處理PDF的資料具有相當程度的挑戰性。
大家有沒有曾經為了擷取PDF中的內容而氣到內傷的經驗?如果單純手動Copy & Paste裡面的內容,往往需要做不少後製的格式調整。
PDF某種程度是設計讓你無法輕易去更改,它就像一張畫布的概念。
0 0 64 0
本篇內容來自以下教室