怎么用python一步步提取PPT中的图片
发表于:2024-11-26 作者:千家信息网编辑
千家信息网最后更新 2024年11月26日,这篇文章主要介绍怎么用python一步步提取PPT中的图片,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一、实现原理其实实现原理很简单,我们的pptx文件其实是一个压缩包。我们
千家信息网最后更新 2024年11月26日怎么用python一步步提取PPT中的图片
这篇文章主要介绍怎么用python一步步提取PPT中的图片,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
一、实现原理
其实实现原理很简单,我们的pptx文件其实是一个压缩包。我们可以直接修改pptx文件的后缀,改成zip然后解压,比如下面这个:
这是解压后的文件。我们可以在ppt目录下找到一个media目录,这个目录下就是我们要的图片的。这个目录包含了PPT的所有多媒体文件。
知道这点后,我们就可以选择用Python来解压出PPT中的media目录就可以提取出所有图片了。
二、提取PPT中的图片
1、打开压缩包
在Python中提供了一个zipfile模块用于处理压缩包文件。我们来看看它的简单操作:
from zipfile import ZipFile# 打开压缩文件f = ZipFile("test.pptx")# 查看压缩包所有文件for file in f.namelist(): print(file)# 关闭压缩包文件f.close()
输出的部分结果如下:
[Content_Types].xml_rels/.relsppt/presentation.xmlppt/slides/_rels/slide2.xml.relsppt/slides/slide1.xmlppt/slides/slide2.xmlppt/slides/slide3.xml
可以看到我们打印出了压缩包的文件。
2、解压文件
我们还可以通过下面的方式打开压缩包:
from zipfile import ZipFilewith ZipFile("test.pptx") as f: for file in f.namelist(): print(file)
通过with
语句,就可以不显示地调用close方法。下面我们看看解压操作:
from zipfile import ZipFilewith ZipFile("test.pptx") as f: for file in f.namelist(): # 解压文件 f.extract(file, path="unzip")
解压文件的操作通过f.extract
来实现,这里传入了两个参数,分别是压缩包文件,和解压路径,如果压缩包有密码还需要传入解压密码。
然后我们还需要判断一下,如果是媒体目录我们才解压。我们添加一点代码:
from zipfile import ZipFilewith ZipFile("test.pptx") as f: for file in f.namelist(): # 如果是media目录下的文件就解压 if file.startswith("ppt/media/"): f.extract(file, path="unzip")
这样我们就实现了PPT图片的提取。
三、提取PPT中的图片
我们把上面代码再完善一下:
import osfrom zipfile import ZipFile# 解压目录unzip_path = "unzip"# 如果解压目录不存在则创建if not os.path.exists(unzip_path): os.mkdir(unzip_path)with ZipFile("test1/test.pptx") as f: for file in f.namelist(): if file.startswith("ppt/media/"): f.extract(file, path=unzip_path)
这里我们就是添加了一个解压目录的创建,这样我们执行的时候就不会因为目录不存在而报错了。
另外,其实我们手动解压然后提取PPT中的图片也是很方便的,也并不会比程序慢。
以上是"怎么用python一步步提取PPT中的图片"这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注行业资讯频道!
文件
目录
图片
代码
内容
原理
密码
就是
篇文章
两个
价值
兴趣
参数
可以通过
后缀
多媒体
媒体
小伙
小伙伴
手动
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
软件开发实习计划与实施步骤
网络安全编辑需要什么技能
网络服务器配置安全
网络安全法的三防
随着计算机网络技术的发展
网络代理服务器ip
云呼软件开发
国泰安并购数据库 公告日
国产数据库品牌达梦
论文里的数据库表是怎么做的
数据库建出的表
java版可以进基岩版服务器吗
数据库服务迁移
卧室设计图软件开发
2017网络安全课题
国际网络安全大赛官网
前台内容写入数据库
邯郸计算机应用软件开发哪家正规
神通数据库客户端到期
ocr文字识别软件开发
网络安全无线电手抄报
江苏东银软件开发有限公司
熟练掌握数据库的开发
网络安全编辑需要什么技能
电大数据库应用课程设计
网络安全为人民怎么写
哈尔滨飞扬软件开发有限公司
常见的中间数据库有哪些
网络安全专题讲座英语怎么说
按日期删除数据库