CentOS下使用LibreOffice实现文档格式的转换方式
发表于:2025-02-02 作者:千家信息网编辑
千家信息网最后更新 2025年02月02日,项目需求,对上传的文档进行一些预处理,如果用户上传了doc格式的文档,需要将其处理为docx或者pdf格式,以便后续的流程对文档内容进行提取。先是试了一下phpoffice/phpword这个包,发现
千家信息网最后更新 2025年02月02日CentOS下使用LibreOffice实现文档格式的转换方式
项目需求,对上传的文档进行一些预处理,如果用户上传了doc格式的文档,需要将其处理为docx或者pdf格式,以便后续的流程对文档内容进行提取。
先是试了一下phpoffice/phpword
这个包,发现其对doc的转换很不理想,这个包更适合用来根据内容生成文档,而不是转换文档,不是太适合我这种需求。
然后发现了LibreOffice这个开源工具,经过使用,效果很好,分享一下。
服务器是CentOS7,直接使用yum安装LibreOffice,大概需要600MB+ 的磁盘空间:
# 装之前可以先删除一下,防止之前装过yum remove libreoffice-*yum install libreoffice
等待安装完成后,确认一下版本啥的,虽然官方已经到6.1版本了,yum里面还是5.3.6的包,不过用起来并没有什么毛病,在这里我还是建议大家使用各自的Linux系统的包管理工具来安装,这样可以省去很多麻烦的。
[root@localhost /]# soffice --versionLibreOffice 5.3.6.1 30(Build:1)
不会用的话可以使用soffice --help看一下帮助,非常多的参数和使用案例,转换格式就很简单:
soffice --headless --convert-to docx /opt/upload/source/123.doc --outdir /opt/upload/source
以上的命令就是将/opt/upload/source/123.doc
文件转换成docx格式,输出到/opt/upload/source
文件夹里。
默认情况下:
- 会使用源文件名+新的扩展名保存输出文件;
- 会覆盖outdir里已经有的同名文件;
转换成功会输出类似这样的:
convert /opt/upload/source/123.doc -> /opt/upload/source/123.docx using filter : MS Word 2007 XMLOverwriting: /opt/upload/source/123.docx
LibreOffice会根据文件格式自动匹配格式过滤器(filter),至于它支持哪些格式,可以参考一下官网。
总结
以上所述是小编给大家介绍的CentOS下使用LibreOffice实现文档格式的转换方式,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
格式
文档
文件
帮助
输出
内容
工具
版本
还是
需求
支持
方式
成功
出处
参数
命令
官方
就是
建议
情况
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
购买云服务器容易被黑吗
cats未连接服务器
肯德基 服务器错误
防社工网络安全攻击
商汤科技属于几线互联网公司
网络安全的保障是谁提出来的
南宁广信进帮网络技术有限公司
pubg服务器波动
手机云服务器流量不够用
个人自学计算机软件开发
网络安全通讯稿标题
软件开发的英文意思是
网络安全宣传公益创投
长沙高坪网络技术有限公司
天津hp服务器虚拟化部署
网络安全证明
连云港网络安全工程师
茂南区智德网络技术服务部
波兰设置网络安全中心
软件开发之后干嘛
成都汇声软件开发
数字媒体网络技术专业
珠海市集锦软件开发有限公司
互联网科技平台询问汇承优
sql数据库默认大小
移动软件开发选择题
软件开发企业的增值税政策
学好数据库英文
创造与魔法冰原最强服务器
奥汀crm需要加数据库吗