有一种doc文件,office word可以正常打开,但当你想像其他doc文件一样使用libreoffice去操作它的时候会发现里面全是字符串,使用一个编辑器(比如Sublime Text)打开后发现,里面的内容是这样的: From:<由XXX 生成> Subject: Resume MIME-Version:1.0 X-51JOB-FLAG:EhireExport_20190527_ […]
CentOS下使用LibreOffice实现文档格式的转换
项目需求,对上传的文档进行一些预处理,如果用户上传了doc格式的文档,需要将其处理为docx或者pdf格式,以便后续的流程对文档内容进行提取。 先是试了一下phpoffice/phpword这个包,发现其对doc的转换很不理想,这个包更适合用来根据内容生成文档,而不是转换文档,不是太适合我这种需求。 然后发现了LibreOffice这个开源工具,经过使用,效果很好,分享一下。 服务器是CentOS […]