成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁(yè) > 知識(shí)庫(kù) > 使用python處理一萬(wàn)份word表格簡(jiǎn)歷操作

使用python處理一萬(wàn)份word表格簡(jiǎn)歷操作

熱門標(biāo)簽:鄭州智能外呼系統(tǒng)中心 400電話 申請(qǐng) 條件 南京crm外呼系統(tǒng)排名 汕頭電商外呼系統(tǒng)供應(yīng)商 賓館能在百度地圖標(biāo)注嗎 云南地圖標(biāo)注 北京外呼電銷機(jī)器人招商 電銷機(jī)器人 金倫通信 crm電銷機(jī)器人

前言

有一天朋友A向我抱怨,他的老板要求他把幾百份word填好的word表格簡(jiǎn)歷信息整理到excel中,看著他一個(gè)個(gè)將姓名,年齡……從word表格里復(fù)制粘貼到excel里,邊粘貼心里邊暗暗詛咒著自己的boss……但畢竟新手小白,又不能違背老板的意愿說(shuō)我不干了,愛(ài)咋咋地,于是過(guò)來(lái)向我求助。我說(shuō),這事情好辦啊,學(xué)學(xué)python就能解決啊,簡(jiǎn)單容易上手。好了,接下來(lái)進(jìn)入正題。

思路:首先針對(duì)每一份word表格進(jìn)行分析

怎么才能利用python獲取到word表格里面的信息,最初的想法是把word里面的表格轉(zhuǎn)成網(wǎng)頁(yè)格式,畢竟混跡爬蟲(chóng)淺水區(qū)多年,用正則表達(dá)式處理網(wǎng)頁(yè)來(lái)獲取信息是比較輕松的,于是想到把word轉(zhuǎn)成網(wǎng)頁(yè)格式,這么一想,整個(gè)人都瘋了,幾百份文件打開(kāi)然后轉(zhuǎn)成網(wǎng)頁(yè),那也有不少勞動(dòng)量啊。于是在網(wǎng)上搜了許久,發(fā)現(xiàn)docx文件自己本身是壓縮文件,打開(kāi)壓縮包之后竟然發(fā)現(xiàn)里面有個(gè)專門存儲(chǔ)word里面文本的文件。

打開(kāi)文件找,發(fā)現(xiàn)我們想要的信息全都藏在這個(gè)名為document.xml的文件里

于是基本過(guò)程就可以確定了

1. 打開(kāi)docx的壓縮包

2. 獲取word里面的正文信息

3. 利用正則表達(dá)式匹配出我們想要的信息

4. 將信息存儲(chǔ)到txt中(txt可以用excel打開(kāi))

5. 批量調(diào)用上述過(guò)程,完成一萬(wàn)份簡(jiǎn)歷的提取工作

6. (檢查數(shù)據(jù)是否有錯(cuò)誤或缺失)

0x01 獲取docx信息

利用python的zipfile庫(kù)以及re庫(kù)來(lái)處理docx壓縮包里面的document.xml文件里的信息。

import zipfile
import re
def get_document(filepath):
  z = zipfile.ZipFile(filepath, "r")
  text = z.read("word/document.xml").decode("UTF-8")
  text = re.sub(r".*?>", "", text)#去除xml里的所有標(biāo)記符
  ###如果多份簡(jiǎn)歷在同一個(gè)word文件里###
  #table_list = text.split("XX簡(jiǎn)歷")[1:]#依據(jù)簡(jiǎn)歷標(biāo)題切分每一份簡(jiǎn)歷信息
  #return table_list
  return text

打印text的結(jié)果

自此,輸出了簡(jiǎn)歷中的所有相關(guān)信息

0x02 抓取各字段值

接下來(lái)根據(jù)這些相關(guān)信息抓取各個(gè)字段的值

import re
def get_field_value(text):
  value_list = []
  m = re.findall(r"姓 名(.*?)性  別", table)
  value_list.append(m)
  m = re.findall(r"性  別(.*?)學(xué)  歷", table)
  value_list.append(m)
  m = re.findall(r"民 族(.*?)健康狀況", table)
  value_list.append(m)  
  '''
  此處省略其他字段匹配
  '''
  return value_list

這樣就將每個(gè)字段匹配到的內(nèi)容以一個(gè)列表的形式返回了

0x03 將內(nèi)容寫入到文件

接下來(lái)將這個(gè)列表里的內(nèi)容寫入到txt中

str1 = ""
for value in value_list:
  str1 = str1 + str(value[0]) + "\t"#每個(gè)字段值用制表符\t分隔
str1 = str1 + "\n"
with open("result.txt", "a+") as f:#將內(nèi)容以追加形式寫入到result.txt中
  f.write(str1)

以上是將一個(gè)word轉(zhuǎn)成了txt

只要再對(duì)文件夾中的文件進(jìn)行批量處理就ok了

0x04 批量處理完整代碼

以下附上完整代碼

import re
import zipfile
import os
def get_document(filepath):
  z = zipfile.ZipFile(filepath, "r")
  text = z.read("word/document.xml").decode("UTF-8")
  text = re.sub(r".*?>", "", text)#去除xml里的所有標(biāo)記符
  ###如果多份簡(jiǎn)歷在同一個(gè)word文件里###
  table_list = text.split("XX簡(jiǎn)歷")[1:]#依據(jù)簡(jiǎn)歷標(biāo)題切分每一份簡(jiǎn)歷信息
  return table_list
def get_field_value(text):
  value_list = []
  m = re.findall(r"姓 名(.*?)性  別", table)
  value_list.append(m)
  m = re.findall(r"性  別(.*?)學(xué)  歷", table)
  value_list.append(m)
  m = re.findall(r"民 族(.*?)健康狀況", table)
  value_list.append(m)  
  '''
  此處省略其他字段匹配
  '''
  return value_list
cv_list = []
for i in os.listdir(os.getcwd()):
  a = os.path.splitext(os.getcwd() + "\\" + i)#獲取當(dāng)前目錄下所有文件的文件名
  if a[1] == '.docx':#如果文件后綴
    print(os.getcwd()+"\\"+i)
    cv_list = cv_list + get_document(os.getcwd() + "\\" + i)#每份簡(jiǎn)歷信息為一個(gè)列表元素
for i in cv_list:
  value_list = get_field_value(i)
  str1 = ""
  for value in value_list:
    str1 = str1 + str(value[0]) + "\t"
  str1 = str1 + "\n"
  with open("result.txt", "a+") as f:
    f.write(str1)

一萬(wàn)份word表格簡(jiǎn)歷信息轉(zhuǎn)成了txt,然后用excel打開(kāi)txt即可。

補(bǔ)充:python word表格一些操作

數(shù)據(jù)格式(datas): 列表套列表

aa =[ [1,2,3,4,5],[6,7,8,9],[]…]
import os
import requests
import json
import datetime
from docx import Document
from docx.shared import Inches, Pt, Cm
from docx.oxml.ns import qn
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
def create_insert_word_table(datas, stday, etday, s):
  """創(chuàng)建word表格以及插入數(shù)據(jù)"""
  doc = Document()
  doc.styles['Normal'].font.name = 'Calibri' # 是用來(lái)設(shè)置當(dāng)文字是西文時(shí)的字體,
  doc.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋體') # 是用來(lái)設(shè)置當(dāng)文字是中文時(shí)的字體
  # doc.styles['Normal'].font.size = Pt(14) # 設(shè)置所有文字字體大小為14
  distance = Inches(0.5)
  sec = doc.sections[0] # sections對(duì)應(yīng)文檔中的“節(jié)”
  sec.left_margin = distance # 以下依次設(shè)置左、右、上、下頁(yè)面邊距
  sec.right_margin = distance
  sec.top_margin = distance
  sec.bottom_margin = distance
  sec.page_width = Inches(11.7) # 設(shè)置頁(yè)面寬度
  # sec.page_height = Inches(9) # 設(shè)置頁(yè)面高度
  # doc.add_heading() # 設(shè)置標(biāo)題,但是不符合我的條件,只能試用下方p.add_run('我是文字')
  p = doc.add_paragraph() # 添加段落
  p.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER # 設(shè)置中央對(duì)齊
  run = p.add_run('我是文字')
  run.font.size = Pt(22)
  doc.add_paragraph() # 添加空段落
  # 添加表格
  table = doc.add_table(rows=1, cols=10, style='Table Grid')
  table.style.name = 'Table Grid'
  table.style.font.size = Pt(14)
  table.rows[0].height = Cm(20)
  title = table.rows[0].cells
  title[0].text = '姓名'
  title[1].text = '1'
  title[2].text = '2'
  title[3].text = '3'
  title[4].text = '4'
  title[5].text = '5'
  title[6].text = '6 '
  title[7].text = '7'
  title[8].text = '8'
  title[9].text = '9'
  for i in range(len(datas)):
    cels = table.add_row().cells
    for j in range(len(datas[i])):
      # cels[j].text = str(datas[i][j])
      p = cels[j].paragraphs[0]
      p.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER # 設(shè)置中央對(duì)齊
      p.add_run(str(datas[i][j]))
      ph_format = p.paragraph_format
      # ph_format.space_before = Pt(10) # 設(shè)置段前間距
      # ph_format.space_after = Pt(12) # 設(shè)置段后間距
      ph_format.line_spacing = Pt(40) # 設(shè)置行間距
  doc.save('./files/項(xiàng)目總結(jié).docx')

生成示例

可能出現(xiàn)的錯(cuò)誤,[Errno 13] Permission denied: ‘./files/項(xiàng)目進(jìn)展總結(jié).docx'

是因?yàn)槟愦蜷_(kāi)文件未關(guān)閉,操作不了,關(guān)閉他就好了

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • 使用Python 統(tǒng)計(jì)文件夾內(nèi)所有pdf頁(yè)數(shù)的小工具
  • 20行Python代碼實(shí)現(xiàn)一款永久免費(fèi)PDF編輯工具的實(shí)現(xiàn)
  • 用python 制作圖片轉(zhuǎn)pdf工具
  • Python開(kāi)發(fā)的單詞頻率統(tǒng)計(jì)工具wordsworth使用方法
  • Python快速優(yōu)雅的批量修改Word文檔樣式
  • python提取word文件中的所有圖片
  • 教你如何利用Python批量翻譯英文Word文檔并保留格式
  • 詳解用Python把PDF轉(zhuǎn)為Word方法總結(jié)
  • python 三種方法提取pdf中的圖片
  • 只用40行Python代碼就能寫出pdf轉(zhuǎn)word小工具

標(biāo)簽:錫林郭勒盟 梅州 石家莊 懷化 浙江 西寧 文山 昆明

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《使用python處理一萬(wàn)份word表格簡(jiǎn)歷操作》,本文關(guān)鍵詞  使用,python,處理,一萬(wàn),份,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《使用python處理一萬(wàn)份word表格簡(jiǎn)歷操作》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于使用python處理一萬(wàn)份word表格簡(jiǎn)歷操作的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    99国产精品99久久久久久粉嫩| 中文字幕av手机在线| 9999精品| 国产欧美一区二区三区久久人妖| 最近中文字幕2019免费| 国产精品刘玥久久一区| 欧美激情精品久久久久久| av午夜一区麻豆| 欧美福利精品| 久久久久久亚洲精品美女| 亚洲最大福利视频网站| 天天操天天操天天操天天操天天操| 日本成址在线观看| 中文在线字幕观看| 国产黄在线观看| 日本五码在线| 色婷婷综合成人av| 你懂的网站在线观看网址| 亚洲色图制服丝袜| 疯狂蹂躏欧美一区二区精品| 亚洲综合在线免费观看| 日本中文字幕一区二区有限公司| 91精品国产一区二区三区香蕉| 2020国产精品小视频| 亚洲国产精品一区二区第一页| 九九国产精品视频| 337p粉嫩大胆噜噜噜噜噜91av| 亚洲一区二区动漫| 国产欧美在线一区二区| 粉嫩av一区二区三区四区五区| 欧美白嫩的18sex少妇| 2023国产精品| 久草视频免费在线| 亚洲精品手机在线观看| 天天免费亚洲黑人免费| 自拍偷拍 国产| 在线综合+亚洲+欧美中文字幕| 日韩精品一区二区亚洲av| 国产宾馆实践打屁股91| 亚洲视频网站在线观看| 国产精品激情偷乱一区二区∴| 日本在线观看免费视频| 91国偷自产一区二区开放时间| 国产区av在线| 国产av麻豆mag剧集| 国产视频亚洲| 国产高潮在线| 国产女主播喷水高潮网红在线| 嫩草伊人久久精品少妇av杨幂| 日韩视频永久免费观看| 久久久久久久香蕉网| 精品一区二区三区四区五区| 一区在线影院| 亚洲精品99久久久久中文字幕| 中文天堂在线视频| 国产欧美日韩精品一区二区免费| 亚洲国内欧美| 亚洲第一天堂影院| 日韩精品电影一区亚洲| 日韩免费电影一区二区三区| 蜜桃导航-精品导航| 最新国产の精品合集bt伙计| 天堂在线中文视频| 一区二区三区欧美| 99在线观看视频| 亚洲天堂av免费在线观看| 久久久久久av无码免费看大片| 一级日本不卡的影视| 群体交乱之放荡娇妻一区二区| 九九免费精品视频在线观看| 国产精品每日更新在线播放网址| 久久综合伊人77777蜜臀| 国产高清一级毛片在线不卡| 亚洲 欧美 日韩 在线| 中文在线有码| 国产精品美女久久久久av超清| 最近2019中文免费高清视频观看www99| 在线播放中文字幕| 香蕉视频911| 久久久另类综合| 成人av电影免费在线播放| 欧美 日韩 国产 高清| 黄色小视频免费网站| 亚洲女人初尝黑人巨大| 久久成人国产精品入口| 日韩国产在线观看一区| 日本三级片在线观看| 日本蜜桃在线观看视频| caopo在线| 97婷婷涩涩精品一区| 国产第一亚洲| 一个人免费观看在线视频www| 黄色网址网站| 成人欧美视频在线观看播放| 激情视频亚洲| 国产精品第一页第二页第三页| 最近中文字幕无免费| 国产精品密蕾丝袜| 国产精品免费播放| 99福利在线观看| 亚洲第一二三四五区| 成人性免费视频| 国产精品igao视频网网址不卡日韩| 亚洲一区二区三区乱码aⅴ| 国产大片中文字幕在线观看| 国产精品久久久久久久久免费丝袜| 欧美一区2区三区4区公司二百| 永久免费黄色片| 色悠悠久久综合| 天堂va欧美va亚洲va老司机| 免费污污视频在线观看| 中文字幕中文字幕在线中高清免费版| 日本中文字幕高清视频| 男人和女人做事情在线视频网站免费观看| 那种视频在线观看| 免费黄网站观看| 少妇高清精品毛片在线视频| 国产av一区二区三区传媒| 在线观看视频免费一区二区三区| 91精品婷婷国产综合久久竹菊| xxxx成人| 精品电影在线观看| 制服师生第一页| 成人1区2区| 欧美久久久久久久久中文字幕| 精品国产sm最大网站免费看| 成人免费毛片日本片视频| 国产日产精品一区二区三区的介绍| eeuss影院www在线观看| 不卡毛片在线看| 日韩欧乱色一区二区三区在线| 欧美本精品男人aⅴ天堂| 国产亚洲欧美日韩美女| 一区二区三区高清在线观看| 秋霞在线一区| 很黄很黄的网站免费的| 黄动漫在线免费观看| 久久99精品久久久野外观看| 精品视频一区二区不卡| 欧美aaaaa喷水| 国产原创在线播放| 99国产牛牛视频在线网站| 影院免费视频| 三年中国中文在线观看免费播放| 欧美视频中文字幕| 天天搞夜夜操| 天天躁日日躁狠狠躁免费麻豆| 伊是香蕉大人久久| 国产在线无码精品| 亚洲精品不卡| 亚洲乱码中文字幕| 久久99精品久久久| 在线天堂中文字幕| 精品日本12videosex| 男人在线资源站| 国产精品视频成人| 香蕉精品视频在线观看| 99国产精品无码| 欧美日本韩国国产| 日本一区二区三区免费看| 91精品国产视频| 川上优的av在线一区二区| 欧美成人综合色| 精品国产综合| 99在线无码精品入口| 精品国产乱码一区二区| 欧美肥老太太性生活| 日韩精品极品视频| 最新亚洲人成网站在线观看| 亚洲自拍第二页| 亚洲视频电影在线| 国产精品免费一区二区三区在线观看| 又黄又爽的视频在线观看| 精品伦理一区二区三区| 婷婷视频一区二区三区| av观看久久| 精品久久久中文字幕| 欧美18视频| 国产成人日日夜夜| 99reav| 亚洲一区二区三区四区在线免费观看| av免费观看久久| 伊人久久大香线蕉av超碰| 欧美乱妇一区二区三区不卡视频| 久久婷婷国产综合国色天香| 超级碰碰视频| 久久久久久婷| 午夜激情视频网| 欧美一卡二卡三卡四卡| 毛片av在线| 欧美在线一区二区三区四区| 国产精品白丝一区二区三区| 国产国产人免费人成免费视频| 亚洲午夜在线观看视频在线| 久久躁狠狠躁夜夜爽| 开心激情综合| 日韩女优av电影| 日韩手机在线导航| 欧美日韩综合不卡| 一区 二区 三区| 精品樱空桃一区二区三区| 少妇高潮久久77777| 国产在线视频网| 色中文字幕在线观看| 国产又粗又爽视频| 你懂的视频在线观看资源| 国产在线观看一区二区| 亚洲日本护士毛茸茸| 无码人妻丰满熟妇精品| 欧美影视一区在线| 欧美性少妇18aaaa视频| 中文字幕亚洲综合久久五月天色无吗''| 精品国产高清a毛片无毒不卡| 亚洲在线视频| 欧美影院精品一区| 国产成人一区| 黄色一级视频免费| 国产精品∨欧美精品v日韩精品| 福利小视频在线观看| 好吊妞视频这里有精品| 亚洲欧美日本一区| 一本—道久久a久久精品蜜桃| 丰满大乳奶做爰ⅹxx视频| 中文字幕影片免费在线观看| 97久久久免费福利网址| 精品在线免费观看视频| 今天免费高清在线观看国语| 亚洲午夜精品一区| 久久99这里只有精品| 色噜噜狠狠成人网p站| 国产精一区二区| 亚洲国产99| 亚洲爆乳无码精品aaa片蜜桃| 一区二区三区在线资源| 西瓜成人精品人成网站| 香港日本三级视频| 欧美高清激情brazzers| 国产精品欧美在线观看| 亚洲大尺度在线观看| 久久久女人电视剧免费播放下载| 一个色综合久久| 美女在线视频免费| 欧美日韩三级一区二区| 免费成人深夜夜行网站视频| 亚洲第一中文字幕| 中文字幕一区久久| 香蕉成人伊视频在线观看| 在线免费观看欧美| 国产精品一区二区不卡| 午夜日韩av| 韩国三级av在线免费观看| 精品人妻一区二区色欲产成人| 最近中文字幕免费观看| gay视频丨vk| 欧美精品在线视频观看| 男人天堂1024| 日韩一级片在线免费观看| 国产精品午夜春色av| 欧美va日韩va| 国产精品美女久久久久av爽李琼| 国产精品www在线观看| 九九视频在线观看| 香港久久久电影| 亚洲午夜18毛片在线看| 成人小视频免费看| 一区二区三区不卡视频在线观看| 一本综合久久| 精品日韩欧美一区二区| 国产v亚洲v天堂无码| 欧美特级www| 美女扒开尿口让男人操| 国产成人av电影在线播放| 成年永久一区二区三区免费视频| 免费精品一区二区| 日本久久久久久久久久久| 久久日本片精品aaaaa国产| a级毛片免费观看在线| 亚洲av成人精品日韩在线播放| 蜜臀久久99精品久久久久久| 日韩小视频网址| 日韩视频在线观看国产| 欧美人体大胆444www| 国产bdsm视频| 诱受h嗯啊巨肉高潮| 日韩小视频网址| 中文天堂在线资源| 欧美日产一区二区三区在线观看| 性做久久久久久久免费看| 校花撩起jk露出白色内裤国产精品| 四虎av在线| 极品美乳网红视频免费在线观看| 羞羞视频网站在线免费观看| 91精品国产综合久久精品| 亚洲综合色成人| 天天天天天天天天操| 巨大荫蒂视频欧美大片| 人妻丰满熟妇av无码区hd| 奇米影视亚洲狠狠色| 精品在线观看一区| 国产高清视频免费最新在线| 日本xxxx高清色视频| 欧美影视一区二区三区| 欧美亚洲精品一区| 麻豆精品久久精品色综合| 久久精品卡一| 国产精品系列视频| 黄色成人在线网站| 亚洲午夜精品久久久久久久久久久久| 国产福利一区二区在线精品| 欧美乱妇视频| 国产美女18xxxx免费视频| 日本韩国视频一区二区| 欧美性猛交xxxx| 在线观看欧美成人| 日本欧美加勒比视频| 色综合91久久精品中文字幕| 丰满少妇一级片| 在线播放亚洲精品| 久久精品国产久精国产爱| 久久人人爽爽人人爽人人片av| 中文字幕一区二区三区人妻| 亚洲高清资源在线观看| 91视频亚洲| fc2成人免费视频| 一区二区中文字幕| 久久精品国产一区二区三区不卡| 日韩三级免费看| 日本电影全部在线观看网站视频|