Python怎么将Office文件转PDF
发表于:2024-11-30 作者:千家信息网编辑
千家信息网最后更新 2024年11月30日,本篇内容介绍了"Python怎么将Office文件转PDF"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所
千家信息网最后更新 2024年11月30日Python怎么将Office文件转PDF
本篇内容介绍了"Python怎么将Office文件转PDF"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
安装 win32com
在实战之前,需要安装 Python 的 win32com,详细安装步骤如下:
使用 pip 命令安装
pip install pywin32
如果我们遇到安装错误,可以通过python -m pip install --upgrade pip
更新云端的方式再进行安装即可:
python -m pip install --upgrade pip
下载离线安装包安装
如果 pip 命令未安装成功的话还可以下载离线包安装,方法步骤如下:首先在官网选择对应的 Python 版本下载离线包: sourceforge.net/projects/pywin32/files/pywin32/Build%20221/ 下载好后傻瓜式安装好即可。
文件转换逻辑
详细代码如下:
class PDFConverter: def __init__(self, pathname, export='.'): self._handle_postfix = ['doc', 'docx', 'ppt', 'pptx', 'xls', 'xlsx'] # 支持转换的文件类型 self._filename_list = list() #列出文件 self._export_folder = os.path.join(os.path.abspath('.'), 'file_server/pdfconver') if not os.path.exists(self._export_folder): os.mkdir(self._export_folder) self._enumerate_filename(pathname) def _enumerate_filename(self, pathname): ''' 读取所有文件名 ''' full_pathname = os.path.abspath(pathname) if os.path.isfile(full_pathname): if self._is_legal_postfix(full_pathname): self._filename_list.append(full_pathname) else: raise TypeError('文件 {} 后缀名不合法!仅支持如下文件类型:{}。'.format(pathname, '、'.join(self._handle_postfix))) elif os.path.isdir(full_pathname): for relpath, _, files in os.walk(full_pathname): for name in files: filename = os.path.join(full_pathname, relpath, name) if self._is_legal_postfix(filename): self._filename_list.append(os.path.join(filename)) else: raise TypeError('文件/文件夹 {} 不存在或不合法!'.format(pathname)) def _is_legal_postfix(self, filename): return filename.split('.')[-1].lower() in self._handle_postfix and not os.path.basename(filename).startswith( '~') def run_conver(self): print('需要转换的文件数是:', len(self._filename_list)) for filename in self._filename_list: postfix = filename.split('.')[-1].lower() funcCall = getattr(self, postfix) print('原文件:', filename) funcCall(filename) print('转换完成!')
doc/docx 转换为 PDF
doc/docx 转换为 PDF 部分代码如下所示:
def doc(self, filename): name = os.path.basename(filename).split('.')[0] + '.pdf' exportfile = os.path.join(self._export_folder, name) print('保存 PDF 文件:', exportfile) gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 4) pythoncom.CoInitialize() w = Dispatch("Word.Application") pythoncom.CoInitialize() # 加上防止 CoInitialize 未加载 doc = w.Documents.Open(filename) doc.ExportAsFixedFormat(exportfile, constants.wdExportFormatPDF, Item=constants.wdExportDocumentWithMarkup, CreateBookmarks=constants.wdExportCreateHeadingBookmarks) w.Quit(constants.wdDoNotSaveChanges) def docx(self, filename): self.doc(filename)
ppt/pptx 转换为 PDF
ppt/pptx 转换为 PDF 部分代码如下:
def ppt(self, filename): name = os.path.basename(filename).split('.')[0] + '.pdf' exportfile = os.path.join(self._export_folder, name) gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 4) pythoncom.CoInitialize() p = Dispatch("PowerPoint.Application") pythoncom.CoInitialize() ppt = p.Presentations.Open(filename, False, False, False) ppt.ExportAsFixedFormat(exportfile, 2, PrintRange=None) print('保存 PDF 文件:', exportfile) p.Quit() def pptx(self, filename): self.ppt(filename)
xls/xlsx 转换为 PDF
def xls(self, filename): name = os.path.basename(filename).split('.')[0] + '.pdf' exportfile = os.path.join(self._export_folder, name) pythoncom.CoInitialize() xlApp = DispatchEx("Excel.Application") pythoncom.CoInitialize() xlApp.Visible = False xlApp.DisplayAlerts = 0 books = xlApp.Workbooks.Open(filename, False) books.ExportAsFixedFormat(0, exportfile) books.Close(False) print('保存 PDF 文件:', exportfile) xlApp.Quit() def xlsx(self, filename): self.xls(filename)
执行转换逻辑
if __name__ == "__main__": # 支持文件夹批量导入 #folder = 'tmp' #pathname = os.path.join(os.path.abspath('.'), folder) # 也支持单个文件的转换 pathname = "G:/python_study/test.doc" pdfConverter = PDFConverter(pathname) pdfConverter.run_conver()
"Python怎么将Office文件转PDF"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!
文件
支持
代码
内容
命令
文件夹
更多
步骤
知识
类型
逻辑
部分
实用
成功
学有所成
接下来
云端
件数
傻瓜
单个
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
开源bi数据库架构
数据库给时间转换英文月份
网吧网络安全审批表
服务器管理后台密钥
网络安全知识例子
网络安全宣传活动思路与目标
属于网络安全技术的是什么
数据库时间类型默认值
网络技术毕业目的
云技术不就是数据库吗
广州管理软件开发哪家好
op是什么服务器中的缩写
企业运营软件开发
平谷区网络技术一体化
动态博弈网络技术
政务软件开发合同
数据库设置int长度
软件开发技术和实现
饥荒服务器1核1g
信号集中监测网络安全注意事项
pcb不同网络安全间距
亿咖通科技互联网怎么样
服务器内存模块是什么意思
网络技术和平面设计哪个好
hp服务器机柜
网络安全员的证书
河南省网络安全答题答案
云服务器配置表
一流软件开发企业
宝德网络安全梅振书