成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁 > 知識庫 > 詳解用Python把PDF轉(zhuǎn)為Word方法總結(jié)

詳解用Python把PDF轉(zhuǎn)為Word方法總結(jié)

熱門標(biāo)簽:外呼不封號系統(tǒng) 電信營業(yè)廳400電話申請 幫人做地圖標(biāo)注收費算詐騙嗎 江蘇房產(chǎn)電銷機器人廠家 溫州旅游地圖標(biāo)注 蘇州電銷機器人十大排行榜 悟空智電銷機器人6 荊州云電銷機器人供應(yīng)商 遼寧400電話辦理多少錢

先講一下為啥要寫這個文章,網(wǎng)上其實很多這種PDF轉(zhuǎn)化的代碼和軟件。我一直想用Python做,但是網(wǎng)上搜到的代碼很多都不能用,很多是2.7版本的代碼,再就是PDF需要用到的庫在導(dǎo)入的時候,很多的報錯,解決起來特別費勁,而且自從2021年初以來,似乎網(wǎng)上很少有關(guān)PDF轉(zhuǎn)化的代碼出現(xiàn)了。我在研究了很多代碼和pdfminer的用法后,總結(jié)了幾個方法,目前這幾種方法可以解決大多數(shù)格式的轉(zhuǎn)化,后面我也專門放了提取PDF表格的代碼,文末有高效的免費在線工具推薦。

下面這個是我最最推薦的方法 ,簡單高效 ,只要是標(biāo)準(zhǔn)PDF文檔,里面的圖片和表格都可以保留格式

# pip install pdf2docx #安裝依賴庫
from pdf2docx import Converter

pdf_file = r'C:\Users\Administrator\Desktop\新建文件夾\mednine.pdf'
docx_file = r'C:\Users\Administrator\Desktop\Python教程\02.docx'

# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file, start=0, end=None)
cv.close()

下面是另外三種常用方法

1 把標(biāo)準(zhǔn)格式的PDF轉(zhuǎn)為Word,測試環(huán)境Python3.6.5和3.6.6(注意PDF內(nèi)容僅僅是文字為主的里面沒有圖片圖表的適用,不適合掃描版PDF,因為那只能用圖片識別的方式進行)

from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from pdfminer.pdfpage import PDFPage
from io import StringIO
import sys
import string
from docx import Document


def convert_pdf_2_text(path):
    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    
    device = TextConverter(rsrcmgr, retstr, codec='utf-8', laparams=LAParams())
    interpreter = PDFPageInterpreter(rsrcmgr, device)
    
    with open(path, 'rb') as fp:
        for page in PDFPage.get_pages(fp, set()):
            interpreter.process_page(page)
            #print(retstr.getvalue())  
        text = retstr.getvalue()
    device.close()
    retstr.close()
    return text


def pdf2txt():
    text=convert_pdf_2_text(path)
    with open('real.txt','a',encoding='utf-8') as f:
        for line in text.split('\n'):
            f.write(line+'\n')

        

def remove_control_characters(content):
    mpa = dict.fromkeys(range(32))
    return content.translate(mpa)
    
def save_text_to_word(content, file_path):     

    doc = Document()
    for line in content.split(''):
        print(line)
            
        paragraph = doc.add_paragraph()
        paragraph.add_run(remove_control_characters(line))
    doc.save(file_path)


if __name__ == '__main__':
    path = r'C:\Users\mayn\Desktop\程序臨時\培訓(xùn)教材.pdf'  # 你自己的pdf文件路徑及文件名 不適合掃描版 只適合標(biāo)準(zhǔn)PDF文件
    text = convert_pdf_2_text(path)
    save_text_to_word(text, 'output.doc')  #PDF轉(zhuǎn)為word方法
    #pdf2txt()  #PDF轉(zhuǎn)為txt方法

2專門提取PDF里面的表格,使用pdfplumber適合標(biāo)準(zhǔn)格式的PDF

import pdfplumber
import pandas as pd
import time
from time import  ctime
import psutil as ps 
#import threading
import gc
pdf = pdfplumber.open(r"C:\Users\Administrator\Desktop\新建文件夾\mednine.pdf")
N=len(pdf.pages)
print('總共有',N,'頁')

def pdf2exl(i): # 讀取了第i頁,第i頁是有表格的,
    print('********************************************************************************************************************************************************')
    print('正在輸出第',str(i+1),'頁表格')
    print('********************************************************************************************************************************************************')   
    p0 = pdf.pages[i]
    try:
        table = p0.extract_table()
        print(table)
    
        df = pd.DataFrame(table[1:], columns=table[0])
    #print(df)
        df.to_excel(r"C:\Users\Administrator\Desktop\新建文件夾\Model"+str(i+1)+".xlsx")
    
        #df.info(memory_usage='deep')
        
        
    except Exception as e:
        print('第'+str(i+1)+'頁無表格,或者檢查是否存在表格')       
       
        pass
    #print('目前內(nèi)存占用率是百分之',str(ps.virtual_memory().percent),'    第',str(i+1),'頁輸出完畢')
    print('**********************************************************************************************************************************************************')
    print('\n\n\n') 
    time.sleep(5)


def dojob1():  #此函數(shù)  直接循環(huán)提取PDF里面各個頁面的表格 
    print('*********************')
    for i in range(0,N):
        pdf2exl(i)    

3也可以提取PDF里面的表格,使用camelot(camelot的安裝可能需要點耐心,反正用的人不多)

import camelot
import wand

# 從PDF文件中提取表格

def output(i):  
    #print(tables)
    #for i in range(5):
    tables = camelot.read_pdf(r'C:\Users\Administrator\Desktop\新建文件夾\mednine.pdf', pages=str(i), flavor='stream')
    print(tables[i])
    
# 表格數(shù)據(jù)
    print(tables[i].data)
    
    tables[i].to_csv(r'C:\Users\Administrator\Desktop\新建文件夾\002'+str(i)+r'.csv')


def plotpdf():
        # 這個是畫pdf 結(jié)構(gòu)的函數(shù) 現(xiàn)在不能用 不要打開
    
    #print(tables[0])
    tables = camelot.read_pdf(r'C:\Users\mayn\Desktop\vcode工作區(qū)\11\路基.pdf', pages='200', flavor='stream')
    camelot.plot(tables[0], kind='text')
    print(tables[0])
    plt.show()
    # 繪制PDF文檔的坐標(biāo),定位表格所在的位置  
    #plt = camelot.plot(tables[0],kind='text')
    #plt.show()
    #table_df = tables[0].df

#plotpdf() 
#i=3
#output(i)
for i in range(0,2):
    try:    
        output(i)
    except Exception as e:
        print('第'+str(i)+'頁沒找到表格啊啊啊')
        pass 
    continue

以下是pdfplumber測試效果

源文件如下

提取結(jié)果

最后補充2個免費轉(zhuǎn)換的網(wǎng)站感覺還比較好用,關(guān)鍵是免費

http://pdfdo.com/pdf-to-word.aspx

http://app.xunjiepdf.com/pdf2word/

到此這篇關(guān)于詳解用Python把PDF轉(zhuǎn)為Word方法總結(jié)的文章就介紹到這了,更多相關(guān)Python把PDF轉(zhuǎn)為Word內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python解析PDF程序代碼
  • python實現(xiàn)csdn全部博文下載并轉(zhuǎn)PDF
  • Python合并多張圖片成PDF
  • Python提取PDF指定內(nèi)容并生成新文件
  • python操作mysql、excel、pdf的示例
  • python pdfkit 中文亂碼問題的解決方案
  • python 三種方法提取pdf中的圖片
  • Python實現(xiàn)給PDF添加水印的方法
  • Python讀取pdf表格寫入excel的方法
  • Python 多張圖片合并成一個pdf的參考示例

標(biāo)簽:三沙 黃山 景德鎮(zhèn) 喀什 臺灣 宿遷 欽州 濟南

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《詳解用Python把PDF轉(zhuǎn)為Word方法總結(jié)》,本文關(guān)鍵詞  詳解,用,Python,把,PDF,轉(zhuǎn)為,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《詳解用Python把PDF轉(zhuǎn)為Word方法總結(jié)》相關(guān)的同類信息!
  • 本頁收集關(guān)于詳解用Python把PDF轉(zhuǎn)為Word方法總結(jié)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    亚洲一级网站| www国产91| 国产精品777777| 天天干天天干天天操| 国产精品美女| 99国产精品久久一区二区三区| 很黄很黄的网站免费的| 麻豆免费精品视频| 欧美日韩激情一区二区三区| 在线视频91| 亚洲欧洲在线看| 亚洲精品孕妇| 91偷拍一区二区三区精品| 一本久道中文无码字幕av| 四虎国产精品免费久久5151| 成人全视频免费观看在线看| 日韩欧美精品中文字幕| 成人禁用看黄a在线| 久久久亚洲国产天美传媒修理工| 中文字幕免费在线观看| 亚洲mv大片欧洲mv大片| 国产精品无码久久久久久| 亚洲精品888| 精品盗摄一区二区三区| 久久www免费人成看片高清| 91免费视频网址| 亚洲乱码在线| 久久久精品亚洲| 国产资源在线看| 成人在线免费观看91| 操人视频免费看| 国产精品不卡视频| 久久av免费看| 精品素人av| 91丨九色丨蝌蚪| 好吊视频一二三区| 亚洲激情亚洲| 一个色综合av| 成人性生交大片免费看中文网站| 亚洲男女自偷自拍图片另类| 久热这里有精品| 妖精一区二区三区精品视频| 综合成人在线| 男人的天堂免费在线视频| 亚洲妇熟xx妇色黄蜜桃| 要久久爱电视剧全集完整观看| 精品国产免费视频| 欧美日韩加勒比精品一区| 日日骚一区二区三区| 337p日本欧洲亚洲大胆张筱雨| 欧美视频www| 高潮一区二区| x88av在线| 精品久久久久久中文字幕大豆网| 少妇熟女视频一区二区三区| 黑人巨大精品欧美一区二区三区| 日韩久久精品视频| 成年女人免费v片| 日日夜夜精品免费视频| 日韩在线观看免费全集电视剧网站| av高清久久久| 佐佐木明希av| 日韩福利一区二区三区| 精品无线一线二线三线| 国精品一区二区三区| 福利网在线观看| 中文字幕在线观看1| 欧美一二三视频| 在线观看国产福利| 国产男女猛烈无遮挡91| 婷婷夜色潮精品综合在线| 116极品美女视频在线观看| 亚洲区综合中文字幕日日| 丁香六月综合激情| 亚洲a∨无码无在线观看| 182在线视频观看| 国产男小鲜肉同志免费| 欧美影视一区二区三区| 久久综合社区| 国产农村妇女精品一区二区| 奇米影视一区二区三区小说| 欧美精品导航| 伊人在线视频| 可以免费看不卡的av网站| 国产理论电影在线| 日韩精品一区二区三区第95| 岛国av免费在线| av成人手机在线| 欧美综合一区二区| 成人自拍av| 最好看的中文字幕久久| 亚洲最色的网站| 久久亚洲电影天堂| 97精品伊人久久久大香线蕉| 天堂久久一区二区三区| 国产粉嫩一区二区三区在线观看| 欧美xxxxbbbb在线播放| 日韩av资源| 在线观看亚洲视频啊啊啊啊| 四虎永久免费影库二三区| 精品亚洲第一| 国产午夜亚洲精品羞羞网站| 91精品国产高清自在线看超| 本网站久久精品| 成人网18免费网站| 日韩和的一区二区| 男人网站视频| 精品免费在线观看| 国产精品久久久久毛片软件| 精品视频在线一区二区| 亚洲狠狠婷婷综合久久久久图片| 91成人精品观看| 性感美女福利视频| 日韩精品免费| 95在线视频| 久久久亚洲精品石原莉奈| 色视频在线观看福利| 91久久麻豆| 福利视频网址| 免费在线一区二区三区| 成人嫩草影院免费观看| 欧美一级淫片免费视频魅影视频| 亚洲免费福利视频| 久久久久久亚洲精品不卡| 国产一区二区三区在线看麻豆| 亚洲爆乳无码一区二区三区| 日韩中字在线| 视频在线观看一区二区| 少妇视频一区二区| 日韩欧美国产一区二区三区| 奇米视频888战线精品播放| 久热av在线| 秋霞成人午夜伦在线观看| 成人福利在线观看视频| 国产成人精品一区二区三区四区| 区一区二视频| 啊灬啊灬啊灬啊灬高潮在线看| 超碰在线超碰在线| yy111111少妇影院日韩夜片| 亚洲精品国产一区二| 国产美女情趣调教h一区二区| 久久性感美女视频| 99久久99久久精品免费看蜜桃| 最新中文字幕2018| 中文字幕v亚洲ⅴv天堂| 午夜69成人做爰视频| 日本一级片在线播放| 在线视频国内一区二区| 精品国产乱码久久久久久蜜臀| 中文字幕手机在线视频| 国产三级做爰在线观看| 久久久无码中文字幕久...| 中文字幕av久久爽av| 国产精品老女人| 亚洲免费视频中文字幕| 国产精品美女在线播放| 中文字幕乱码在线播放| 黄色在线视频网| 不卡视频观看| 新久草在线视频| 成人精品久久久| 亚洲制服少妇| 一区二区三区黄色| 午夜精品一区二区三| 欧美激情在线免费观看| 激情图片小说一区| 天堂av一区二区三区| 欧美日韩国产一中文字不卡| shkd中文字幕久久在线观看| 二区视频在线观看| 国产色在线播放| 国内成人精品视频| 久久久精品国产sm调教网站| 日本久久久久亚洲中字幕| 久久超碰97中文字幕| 国产黄色大片免费看| 欧美自拍视频在线观看| 波多野结衣中文字幕在线播放| 欧美videossexotv100| 4438欧美| 亚洲一区 二区 三区| 日本网站免费观看| 国产一区二区三区视频在线| a级片国产精品自在拍在线播放| 日韩av网址大全| 精品久久久久久中文字幕动漫| 亚洲精品网站在线观看| 伊人影院蕉久影院在线观看| 色综合久久中文字幕综合网| 在线免费观看av电影| 91免费在线视频| 中文字幕 自拍偷拍| 免费污网站在线观看| 九九九九免费视频| 欧美日韩视频网站| 日韩欧美高清一区| 国产精品一区二区久久国产| 三级ai视频| 欧美连裤袜在线视频| 国语对白做受69按摩| 中文字幕亚洲一区二区三区五十路| 九一成人免费视频| 国内视频精品| 国产嫩草在线视频| 97精品国产97久久久久久久久久久久| 91久久久国产精品| 啪啪av大全导航福利网址| 国产精品尤物视频| 黑粗硬长欧美在线视频免费的| 国产精品天堂蜜av在线播放| 成年人免费网站| 人人妻人人澡人人爽精品欧美一区| www.国产.com| 涩爱av在线播放一区二区| 久久亚洲AV成人无码国产野外| 日本人亚洲人jjzzjjz| 日韩一区二区免费在线观看| 91精品国产综合久久精品app| 国产激情视频网址| 日本伊人精品一区二区三区介绍| 三级免费网站| 四虎免费视频| 日韩免费大片| 日本视频在线免费| 国产精品少妇在线视频| 亚洲美女视频在线观看| 精品国产欧美成人夜夜嗨| 视频一区二区三区免费观看| 欧美日韩精品一区二区三区视频| 精品成人久久| 欧美男男青年gay1069videost| 青青青在线视频播放| 一区二区三区四区国产| 一区 二区 三区| 国产午夜视频在线观看| 美女又黄又免费| 日本wwww视频| 深夜福利av你懂的| a成人v在线| 日韩三级一区二区三区| 黄色小视频在线看| 99在线精品观看| 久久久久久久久伊人| 尤物视频网站在线观看| 亚洲欧美成人网| 99热这里只有精品在线播放| 成人18夜夜网深夜福利网| 久久精品一区二区不卡| 最近的2019中文字幕免费一页| 中文字幕有码在线| 98视频精品全部国产| 国产极品精品在线观看| 136福利精品导航| 中文一区一区三区免费在线观看| 日本少妇一区二区三区| 色88888久久久久久影院野外| 美女视频久久久| 凹凸日日摸日日碰夜夜爽1| 欧美国产激情18| 91亚洲男人天堂| 蜜桃视频在线播放| 波波电影院一区二区三区| 一区在线播放视频| 亚洲成人一区二区在线观看| 亚洲国产精品精华液网站| 精品国产精品一区二区夜夜嗨| 四虎永久在线高清国产精品| 青青草原播放器| 日韩视频免费在线观看| 国产成人午夜片在线观看高清观看| 欧美优质美女网站| 91精品人妻一区二区三区| 国产一区二区三区四区在线观看| 国产欧美精品日韩| 少妇激情一区二区三区| 欧美激情黄色片| 男人的天堂a在线| 国产1区2区视频| 91精品在线麻豆| 色琪琪原网站亚洲香蕉| 午夜免费久久久久| 欧美理论电影在线播放| 国产精品涩涩涩视频网站| 全球av集中精品导航福利| 国产在线精品日韩| 亚洲 欧美 日韩 在线| www.com久久久| 一路向西2在线观看| 欧美伊人久久| 无码人妻丰满熟妇区毛片18| 国产成人在线视频| 独立日3在线观看完整版| 一区二区三区欧美亚洲| 老熟妇仑乱视频一区二区| 亚洲在线中文字幕| 九九久久精品一区| 中文字幕色网站| 天天操,天天操| 亚洲v日韩v欧美v综合| 欧美性受xxxx免费视频| 久久夜色电影| 亚洲一区二区三区日韩| 99在线高清视频在线播放| 综合激情亚洲| 亚洲精品国产偷自在线观看| 97在线免费视频观看| 日韩一区二区电影在线观看| 精品欧美激情在线观看| 偷拍自拍在线| 成人亚洲激情网| 国产精品一区二区人人爽| zzijzzij亚洲日本少妇熟睡| 亚洲欧美日韩人成在线播放| 亚洲综合激情另类专区老铁性| av亚洲天堂网| 国产精品传媒麻豆hd| 天堂网在线观看视频| 亚洲一区二区三区在线观看网站| www.91av.com| 日韩精品人妻中文字幕有码| 国产欧美日韩精品一区二区免费| 免费黄色片视频| 亚洲国产美国国产综合一区二区| 国产精品一级二级| 亚洲三区在线观看无套内射| av成人毛片| 亚洲一区二区成人| 无码日韩精品一区二区免费|