跳至主要内容

使用 Python 把 PDF 轉圖片

我們經常需要將 PDF 檔案轉換成圖片格式。

所以這裡我們推薦一個好用的 Python 模組: pdf2image ,它能夠將 PDF 檔案轉換成 PIL 圖片。

安裝依賴

pdf2image 依賴於 pdftoppmpdftocairo,不同作業系統的安裝方式略有不同:

  • Mac:通過 Homebrew 安裝 Poppler:brew install poppler
  • Linux:大多數 Linux 發行版已預裝 pdftoppmpdftocairo。若未安裝,請透過包管理器安裝 poppler-utils
  • 使用 conda:無論哪個平台,都可以使用 conda 安裝 Poppler:conda install -c conda-forge poppler,然後再安裝 pdf2image

安裝 pdf2image

首先,你需要安裝 pdf2image,在終端機中輸入以下指令即可安裝:

pip install pdf2image

使用 pdf2image 轉換 PDF

轉換 PDF 至圖片的基本用法非常簡單:

from pdf2image import convert_from_path

images = convert_from_path('/path/to/your/pdf/file.pdf')

這將把 PDF 的每一頁轉換成一個 PIL 圖片對象,並儲存在 images 列表中。

你也可以從二進制數據轉換 PDF:

images = convert_from_bytes(open('/path/to/your/pdf/file.pdf', 'rb').read())

可選參數

pdf2image 提供了豐富的可選參數,允許你自定義 DPI、輸出格式、頁面範圍等。例如:使用 dpi=300 提高輸出圖片的清晰度,或者使用 first_pagelast_page 指定轉換範圍。

你可以參考:

或是參考我們自己改寫的

來了解更多用法。

結語

pdf2image 是一個功能強大且易於使用的工具,能夠滿足你將 PDF 轉換為圖片的需求。無論是用於文件處理、資料整理,還是內容展示,它都能提供高效的解決方案。