Bytescout PDF Multitool

Bytescout PDF Multitool
软件描述
PDF多用途工具——将PDF转换为文本,从PDF中提取数据为CSV、XML、文本或XLS格式,将PDF转换为HTML,转换为TIFF、PNG、BMP图像等。
官方网站
访问软件的官方网站了解更多信息
bytescout.com
什么是 Bytescout PDF Multitool?
一体化的强大PDF工具套件,适用于数据分析师、管理人员、会计师及软件开发人员的日常使用
优势
• 处理PDF文档时不可或缺的日常工具:
从PDF中提取表格和文本至文本、CSV、JSON、XML格式;
PDF与图像之间的相互转换;
合并与拆分PDF文件;
通过删除文本和调整内容来编辑PDF文件;
自动擦除敏感数据;
读取损坏或格式错误的PDF文件;
提取文件附件及嵌入式媒体(音频和视频);
将扫描文档转换为可搜索文本的PDF文件;
PDF分类与排序;
基于数据提取器(文档解析引擎)创建并测试数据提取模板;
开发者:为PDF.co Web API创建并测试数据提取配置文件
• 采用与ByteScout SDK产品相同的技术先进的PDF提取引擎;
• 开发者:可将此工具用作配置器和演示应用,用于创建和测试可应用于以下ByteScout产品的数据提取配置文件:
ByteScout SDK产品
云Web API(PDF.co)
本地部署Web API(API Server)
功能
• 将PDF转换为CSV、文本、XML、XLS、XLSX、HTML;
• 内置OCR图像转文本引擎,支持从PDF和扫描文档中识别文本(支持英语、德语、西班牙语、法语及其他多种语言);
• 将图像和扫描PDF转换为可搜索文本的PDF文档;
• 自动提取PDF中的表格;
• 在PDF和扫描文档中搜索文本:支持简单文本搜索、正则表达式及模糊文本搜索;
• 拆分PDF、合并PDF、从PDF中提取页面;
• 从文档、PDF档案及PDF集合中提取附件;
• 从XFA和XFDF PDF表单中提取数据;
• 删除PDF及图像中的文本;
• 自动检测并擦除敏感数据(如PII、信用卡号、社会安全号码);
• 将PDF转换为TIFF(多页或单页)、PNG、JPG、BMP,并可调整渲染选项;
• 保留图像、图形、矢量及布局信息,将PDF转换为HTML;
• 打印PDF文档;
• 使用PDF分类器对PDF文件进行排序与分类;
• 支持内置PDF查看器的夜间模式