Linux下使用pdf2htmlEX将pdf转换成html格式

项目上遇到需求:将pdf文件转换成html格式文件,供另外的服务做html解析从而获取文件内容信息,这里我采用的是pdf2htmlEX作为转换工具,效果不错。 这里推荐使用最便捷的方法,直接运行docker容器转换,相当于免安装了。 先安装docker并配置docker服务自启动,参考文章:CentOS7安装Docker配置服务端和容器自启动 直接运行docker进行转换 docker run – […]