成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁 > 知識(shí)庫 > python 三種方法提取pdf中的圖片

python 三種方法提取pdf中的圖片

熱門標(biāo)簽:申請(qǐng)辦個(gè)400電話號(hào)碼 400電話辦理費(fèi)用收費(fèi) 外呼系統(tǒng)前面有錄音播放嗎 鎮(zhèn)江人工外呼系統(tǒng)供應(yīng)商 高德地圖標(biāo)注字母 騰訊地圖標(biāo)注有什么版本 千呼ai電話機(jī)器人免費(fèi) 柳州正規(guī)電銷機(jī)器人收費(fèi) 深圳網(wǎng)絡(luò)外呼系統(tǒng)代理商

有時(shí)我們需要將一份或者多份PDF文件中的圖片提取出來,如果采取在線的網(wǎng)站實(shí)現(xiàn)的話又擔(dān)心圖片泄漏,手動(dòng)操作又覺得麻煩,其實(shí)用Python也可以輕松搞定!
今天就跟大家系統(tǒng)分享幾種Python提取 PDF 圖片的方法。其實(shí)沒有非常完美的方法,每種方法提取效率都不是百分之百,因此可以考慮用多種方法進(jìn)行互補(bǔ),主要將涉及:

  • 基于 fitz 庫和正則搜索提取圖片
  • 基于 pdf2image 庫的兩種方法提取圖片

基于 fitz 庫和正則搜索

fitz 是 pymupdf 的子模塊,需要先用命令行安裝 pymupdf:

pip install pymupdf

但注意導(dǎo)入時(shí)使用 import fitz 導(dǎo)入模塊!

下面的代碼就利用 fitz 庫提取圖片需要通過正則匹配圖片元素,將模板元素轉(zhuǎn)化為像素后再以圖片形式寫出

import fitz
import re
import os

file_path = r'C:\xxx\xxx.pdf' # PDF 文件路徑
dir_path = r'C:\xxx' # 存放圖片的文件夾

def pdf2image1(path, pic_path):
  checkIM = r"/Subtype(?= */Image)"
  pdf = fitz.open(path)
  lenXREF = pdf._getXrefLength()
  count = 1
  for i in range(1, lenXREF):
    text = pdf._getXrefString(i)
    isImage = re.search(checkIM, text)
    if not isImage:
      continue
    pix = fitz.Pixmap(pdf, i)
    new_name = f"img_{count}.png"
    pix.writePNG(os.path.join(pic_path, new_name))
    count += 1
    pix = None

pdf2image1(file_path, dir_path)

運(yùn)行提取示例文件后結(jié)果如下:

可以看到,有一些很小的色塊也被提取成圖片,那么怎么過濾掉它們呢?

有一個(gè)簡單的方法是通過大小過濾,pix 像素在 fitz 庫中存在一個(gè)重要的方法 pix.size 可以反映像素多少,簡單的色素塊該值較低,可以通過設(shè)置一個(gè)閾值過濾。以閾值 10000 為例過濾:

import fitz
import re
import os

file_path = r'C:\xxx\xxx.pdf' # PDF 文件路徑
dir_path = r'C:\xxx' # 存放圖片的文件夾

def pdf2image1(path, pic_path):
  checkIM = r"/Subtype(?= */Image)"
  pdf = fitz.open(path)
  lenXREF = pdf._getXrefLength()
  count = 1
  for i in range(1, lenXREF):
    text = pdf._getXrefString(i)
    isImage = re.search(checkIM, text)
    if not isImage:
      continue
    pix = fitz.Pixmap(pdf, i)
    if pix.size  10000: # 在這里添加一處判斷一個(gè)循環(huán)
      continue # 不符合閾值則跳過至下
    new_name = f"img_{count}.png"
    pix.writePNG(os.path.join(pic_path, new_name))
    count += 1
    pix = None

pdf2image1(file_path, dir_path)

可以看到,全部圖片都被正常提??!

基于 pdf2image 庫的兩種方法

一看名字就知道這個(gè)庫的用處了,官方文檔為https://www.cnpython.com/pypi/pdf2image

可以簡單通過 pip install pdf2image 安裝,但poppler才是真正起做用的轉(zhuǎn)換器,因此需要額外安裝和配置:

  • windows用戶必須安裝poppler for Windows,然后將bin/文件夾添加到PATH
  • Mac用戶必須安裝poppler for Mac

具體發(fā)揮作用的代碼官方文檔也給出了詳細(xì)的說明:

那么我們就分別嘗試這兩種方法:

from pdf2image import convert_from_path,convert_from_bytes
import tempfile
from pdf2image.exceptions import PDFInfoNotInstalledError, PDFPageCountError, PDFSyntaxError
import os

file_path = r'C:\xxx\xxx.pdf' # PDF 文件路徑
dir_path = r'C:\xxx' # 存放圖片的文件夾

def pdf2image2(file_path, dir_path):
  images = convert_from_path(file_path, dpi=200)
  for image in images:
    if not os.path.exists(dir_path):
      os.makedirs(dir_path)
    image.save(file_path + f'\img_{images.index(image)}.png', 'PNG')

pdf2image2(file_path, dir_path)

可以成功提取圖片。再試試第二種方法:

from pdf2image import convert_from_path,convert_from_bytes
import tempfile
from pdf2image.exceptions import PDFInfoNotInstalledError, PDFPageCountError, PDFSyntaxError
import os

file_path = r'C:\xxx\xxx.pdf' # PDF 文件路徑
dir_path = r'C:\xxx' # 存放圖片的文件夾

def pdf2image3(file_path, dir_path):
  images = convert_from_bytes(open(file_path, 'rb').read())
  for image in images:
    if not os.path.exists(dir_path):
      os.makedirs(dir_path)
    image.save(file_path + f'\img_{images.index(image)}.png', 'PNG')

pdf2image3(file_path, dir_path)

可以看到結(jié)果和之前一致,PDF中全部圖片都被提取出來!

再補(bǔ)充一下。核心方法covert_from_bytes包含大量參數(shù),可以自行修改。幾個(gè)常用參數(shù)總結(jié)如下:

參數(shù)

意義

pdf_path

PDF 文檔路徑

dpi

圖像質(zhì)量(如果是學(xué)術(shù)期刊雜志常見 300dpi)

output_folder

將生成的圖像寫入文件夾(而不是直接寫入內(nèi)存)

first_page

起始轉(zhuǎn)換頁數(shù)

last_page

轉(zhuǎn)換至哪一頁

fmt

圖像格式,可以指定為 png,默認(rèn)為 ppm

thread_count

允許參與轉(zhuǎn)換的線程數(shù)

userpw

PDF 的密碼

output_file

輸出文件名

poppler_path

指定 poppler 的安裝路徑,一開始配置好就無需指定

值得一提的是thread_count 參數(shù),可以啟動(dòng)多線程會(huì)大大加快轉(zhuǎn)換速度,尤其是 PDF 頁面較多時(shí)。有興趣的讀者可以做嘗試。

以上就是python 三種方法提取pdf中的圖片的詳細(xì)內(nèi)容,更多關(guān)于python 提取pdf中的圖片的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

您可能感興趣的文章:
  • python解析PDF程序代碼
  • python實(shí)現(xiàn)csdn全部博文下載并轉(zhuǎn)PDF
  • Python合并多張圖片成PDF
  • Python提取PDF指定內(nèi)容并生成新文件
  • 詳解用Python把PDF轉(zhuǎn)為Word方法總結(jié)
  • python操作mysql、excel、pdf的示例
  • python pdfkit 中文亂碼問題的解決方案
  • Python實(shí)現(xiàn)給PDF添加水印的方法
  • Python讀取pdf表格寫入excel的方法
  • Python 多張圖片合并成一個(gè)pdf的參考示例

標(biāo)簽:平頂山 海南 大慶 烏蘭察布 郴州 烏蘭察布 合肥 哈爾濱

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python 三種方法提取pdf中的圖片》,本文關(guān)鍵詞  python,三種,方法,提取,pdf,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《python 三種方法提取pdf中的圖片》相關(guān)的同類信息!
  • 本頁收集關(guān)于python 三種方法提取pdf中的圖片的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    久久国产麻豆精品| 丁香花高清视频完整版在线观看| 欧美三级电影在线| 亚洲国产精品福利| 欧美丰满熟妇bbbbbb百度| 欧美成人免费在线观看视频| 7777女厕盗摄久久久| 7m精品国产导航在线| 日韩av无码中文字幕| 极品裸体白嫩激情啪啪国产精品| 国产成人高清激情视频在线观看| 国产特级淫片免费看| 成年人免费在线观看网站| 亚洲图片88| 中文字幕不卡每日更新1区2区| 成人黄18免费网站| 日韩精品久久久久久久玫瑰园| 综合激情五月婷婷| 欧美成人精品福利| 亚洲第一视频在线观看| 欧美亚洲伦理www| 欧美午夜精品一区| 国产精品久久久久久久美男| 艳母动漫在线观看| 人妻熟妇乱又伦精品视频| 九九热视频在线观看| 国产免费一区二区三区在线能观看| 欧美日韩在线综合| 制服视频三区第一页精品| 国产精品免费播放| 国产激情小视频在线| 91 在线视频| 一级少妇精品久久久久久久| 秋霞影院午夜丰满少妇在线视频| 粉嫩av一区二区三区在线播放| 国产精品外围在线观看| 波多野结衣一区二区三区四区| 天堂中文字幕一二区| 淫视频在线观看| 国产一区二区三区四区五区3d| 2021年精品国产福利在线| 麻豆成人免费视频| 国产精品美女久久久久高潮| 久操成人av| 99久久久国产精品免费蜜臀| 伊人久久大香线蕉av超碰演员| 午夜精品久久久久久久91蜜桃| 欧美二区不卡| 日韩va欧美va亚洲va久久| 91嫩草丨国产丨精品| 2020国产精品| 影音先锋亚洲天堂| 成年网站在线看| 欧美视频在线观看视频| 国产一区二区精品丝袜| 狠狠干天天爱| 亚洲一区第一页| 国产一区二区三区亚洲综合| 在线免费观看黄色小视频| 77777少妇光屁股久久一区| 亚洲视频一区二区免费在线观看| 国产精品诱惑| 中文字幕一区二区三区乱码不卡| 日韩激情视频| 成人三级视频在线观看| 国产对白在线播放| 欧美日韩一区二区三区视频播放| 免费在线性爱视频| 中文一区在线播放| 色综久久综合桃花网| 头脑特工队2在线播放| 成人三级视频| 在线观看视频你懂得| 国产高清视频一区| 欧美黄网站色视频| 久久狠狠婷婷| 青草青青国产| 国产精品日韩一区二区三区| 乱子伦一区二区三区| 欧美xxxxx少妇| 久久成人福利视频| h网站视频在线观看| 国产精品性做久久久久久| 91av入口| 日本成人在线不卡| 欧美成人中文| 亚洲深夜福利网站| 91高清免费在线观看| 一区二区电影免费观看| 岛国av一区二区三区| 国产精品老牛| 男的操女的网站| 日韩av无码一区二区三区不卡| 亚洲va综合va国产va中文| 秋霞av一区二区三区| 亚洲国产日韩在线人成电影| 啦啦啦啦免费高清视频在线观看1| 91麻豆产精品久久久久久夏晴子| 不卡av一区二区| 一区二区三区四区精品视频| 国产成人久久精品| av免费在线一区| 午夜偷拍福利视频| 高清视频一区二区| 国产偷国产偷精品高清尤物| a天堂资源在线| 国产精品videossex国产高清| 一级女性全黄久久生活片免费| 国产资源中文字幕| 精品国产乱码久久久久久虫虫漫画| 久久亚洲精品大全| 你懂的国产精品| 成人激情视频| 偷拍一区二区三区四区| 91女厕偷拍女厕偷拍高清| 国产精品无码在线| 欧美一二三四区在线| 黄色网址中文字幕| 亚洲奶大毛多的老太婆| 国产高中女学生第一次| 国产91视觉| 国产一区二区三区久久悠悠色av| 爱啪视频在线观看视频免费| 亚洲爱爱爱爱爱| 国产视频一区二区三区在线播放| 色婷婷综合久久久久中文字幕1| 久久精品夜夜夜夜夜久久| 亚洲一区二区三区三| www.中文字幕久久久| 日韩视频亚洲视频| 欧美1区2区3区4区| 香蕉av一区二区| 亚洲成人网在线| 久久资源中文字幕| 韩国精品福利一区二区三区| 苍井空浴缸大战猛男120分钟| 最近2018年在线中文字幕高清| 97在线日本国产| av免费在线一区二区三区| 国产在线xxxx| 夜夜未满十八勿进的爽爽影视| 91色porny在线视频| 麻豆免费在线观看视频| 日本中文字幕视频一区| 久久综合九色| 在线天堂中文www官网| 亚洲va在线va天堂| 久久久久久久av| 久久精品一区八戒影视| 在线看片第一页欧美| 欧美一级片在线免费观看| 卡通欧美亚洲| 91精品少妇一区二区三区蜜桃臀| 中国日韩欧美久久久久久久久| 欧美日韩国产一区二区三区| 尤物网站在线观看| 97在线观看免费观看高清| 亚洲性生活网站| 加勒比视频一区| www.91av| 黑人巨大精品欧美一区二区三区| 午夜精品一区二区三区在线视频| 另类在线视频| 尤物视频在线观看网站| 日韩精品一区二区三区四区| 五月天婷婷在线观看视频| 亚洲电影网站| 中文幕一区二区三区久久蜜桃| 深田咏美在线x99av| 亚洲欧洲日本在线| 先锋音影av资源中文网| 欧美精品一区二区三区久久久| av高清不卡| 18av千部影片| 精品在线视频一区二区| 在线亚洲不卡| 一本色道久久综合亚洲精品不| 性欧美video另类hd3| a√在线视频| 久久国产精品色| 91网站免费观看| 久久综合偷偷噜噜噜色| 欧美一区二区三区在线观看视频| 日韩欧美一区二| 免费日韩在线视频| 国产成人无码aa精品一区| 草民电影神马电影一区二区| 亚洲天堂网在线视频| 91人妻一区二区三区蜜臀| 欧美性猛交xxxx黑人| 手机在线播放av| 91精品国产乱码久久久| 99精品久久久久久中文字幕| 欧美专区在线观看一区| 中文字幕不卡av| 成年人视频网站免费| 国产精品欧美激情在线观看| 久久在线视频在线| 国产欧美精品一区二区三区介绍| 精品久久久久久中文字幕一区奶水| 欧美一区二区三区观看| 亚洲成人激情综合网| 亚州av影院| 免费黄色在线播放| 欧美极品视频一区二区三区| 免费高清av| 久久一夜天堂av一区二区三区| 精品国产髙清在线看国产毛片| 中文在线免费视频| 亚洲精品91| 乱子伦一区二区三区| 78国产伦精品一区二区三区| 羞羞小视频在线观看| 丁香花免费高清完整在线播放| 日本不卡免费高清视频| 农村少妇一区二区三区四区五区| 欧美日韩女优| 999久久久精品视频| 日本69式三人交| 天天干天天操天天做| 国产无遮挡又黄又爽又色| 亚洲综合中文网| 久久亚洲道色| 综合欧美国产视频二区| 中文字幕有码热在线视频| 日韩理论电影大全| 从欧美一区二区三区| 欧美一区网站| 中文网丁香综合网| 日韩国产综合| 成人欧美一区二区三区视频xxx| 久久97久久97精品免视看| 国产网红在线| 亚洲视频在线一区| 激情综合五月网| 五月天激情开心网| 国产最新精品精品你懂的| 18免费在线视频| 一级毛片免费高清中文字幕久久网| 深夜福利91大全| 午夜dv内射一区二区| 国产小视频国产精品| 欧美日韩123区| 精品亚洲aⅴ乱码一区二区三区| 日韩三级中文字幕| 综合网在线观看| 波多野结衣乳巨码无在线| 巨大荫蒂视频欧美另类大| 国产精品jizz在线观看老狼| 欧美一级在线看| 欧美韩日一区| 亚洲永久免费观看| 亚洲精品伦理| 欧美成人国产精品高潮| 欧美人乱大交xxxxx| 国产精品va在线播放我和闺蜜| 精品人妻互换一区二区三区| 国产精品九色蝌蚪自拍| 国产天堂在线播放视频| 日韩精品在线视频| av在线播放av| 在线免费av网站| 男人本色网站| 日本aⅴ在线观看| 在线免费观看一级片| 国产激情一区| 美女把尿口扒开让男人桶在线观看| 日韩av在线播放中文字幕| 91精品国产91综合久久蜜臀| 国产精品视频一二三四区| 欧美日韩一区精品| jizzjizz免费| 成人av资源网站| 久久久久久久久中文字幕| 精品理论电影| 婷婷中文字幕在线观看| 三上悠亚在线观看二区| 牛牛影视精品影视| 在线观看日韩av先锋影音电影院| 日韩欧美国产午夜精品| 亚洲国产一区二区在线观看| 91色婷婷久久久久合中文| 三级黄色免费观看| 91久久精品国产性色| 欧美亚州一区二区三区| 亚洲精品tv久久久久久久久久| 欧洲美一区二区三区亚洲| 午夜成在线www| 91精品亚洲一区在线观看| 中文字幕在线一区二区三区| 成年人网站免费在线观看| 色婷婷激情一区二区三区| 亚洲国产综合久久精品小蝴蝶| 精品日韩成人av| 最美情侣韩剧在线播放| 午夜精品视频在线观看一区二区| 精品国产伦一区二区三区免费| 性欧美videos另类hd| 欧美草草影院在线视频| 三日本三级少妇三级99| 天天爱天天做天天爽| 久久99久久99| 欧美一区二区麻豆红桃视频| 香蕉污视频在线观看| 国产精品视频免费一区二区三区| 性xxxfreexxxx性欧美| 国产亚洲欧美精品久久久久久| 娇小发育未年成性色xxx8| www.香蕉视频| 九九免费视频| 在线黄色av网站| 国产.精品.日韩.另类.中文.在线.播放| 国产一级片一区二区| 亚洲国产果冻传媒av在线观看| 日韩欧美中文字幕在线视频| 久久在线精品视频| 日韩网址在线观看| 欧美精品国产精品日韩精品| 这里只有精品视频| 日韩有码第一页| 国产精品亚洲视频在线观看| 亚洲一区三区在线观看| 亚洲国产精品高清久久久| 亚洲av色香蕉一区二区三区| 成人精品gif动图一区| 欧美疯狂爱爱xxxxbbbb| 麻豆久久久av免费| 欧美精品一区二区三区一线天视频|