Linux下使用pdf2htmlEX将pdf转换成html格式

项目上遇到需求:将pdf文件转换成html格式文件,供另外的服务做html解析从而获取文件内容信息,这里我采用的是pdf2htmlEX作为转换工具,效果不错。 推荐使用最便捷的方法,直接运行docker容器内的程序转换,避免部署工具所需要的环境等,节约很多时间。 先安装docker并配置docker服务自启动,参考文章:CentOS7安装Docker配置服务端和容器自启动 直接运行docker进行 […]