程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

python 讀取doc 和 docx

編輯:Python
from docx import Document
import os
from win32com import client
file_name="D:/BaiduNetdiskDownload/文案大全匯總"
file_list=os.listdir(file_name)
data_list=[]
for one_file in file_list:
dir_file_name=file_name+"/"+one_file
data_list.append(one_file+"\r")
if "docx" in dir_file_name:
try:
data=Document(dir_file_name)
data_list+=[i.text.strip()+"\r" for i in data.paragraphs]
except:
print()
else:
word = client.Dispatch("Word.Application")
# print("已處理文件:"+files[0])
# 打開文件
try:
doc = word.Documents.Open(dir_file_name)
doc.SaveAs("{}x".format(dir_file_name), 12) # 12表示docx格式
doc.Close()
os.remove(dir_file_name)
except:
print("沒有正常")
with open("25.txt","w",encoding="utf-8") as f:
f.writelines(data_list)

  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved