Tesseract

Tesseract
★4
软件描述
Tesseract.js 是一个 JavaScript 库,可以从图像中提取几乎所有语言的文本。
官方网站
访问软件的官方网站了解更多信息
github.com
安全链接HTTPS
什么是 Tesseract?
Tesseract.js 是一个能够从图像中提取几乎所有语言文字的 JavaScript 库。Tesseract OCR 引擎曾在1995年联合国立大学(UNLV)准确率测试中位列前三。1995年至2006年间,该引擎几乎未进行任何改进,但如今它可能是最准确的开源 OCR 引擎之一。其源代码能够读取二值、灰度或彩色图像,并输出文字内容。内置了 TIFF 读取器,可读取未压缩的 TIFF 图像,也可通过添加 libtiff 库来支持压缩图像的读取。该库提供了多种语言的字典文件,甚至包括使用 Fraktur 和黑体字体排版的文本。
主要功能
🔄 替代方案
22 个选择OSS文档扫描器是一款开源应用程序,可扫描您所有的文档。您可以使用相机进行扫描,也可以导入图片。该应用程序会自动在照片中识别文档,并对图片进行裁剪。
免费 • 开源
查看详情文本识别软件具备无与伦比的文本准确性,可将扫描文档转换为可编辑的Word、Excel文件或可搜索的PDF文件,同时保留原始排版。支持190种语言,通过自动化任务简化操作流程,并内置PDF编辑工具。
付费 • 专有
查看详情
gscan2pdf
★4.8
gscan2pdf 可以进行扫描、清理扫描图像,并对扫描图像或导入的图像(包括现有 PDF、DjVu 或其他文件类型)执行 OCR 处理,生成包含嵌入 OCR 文本的 PDF 和 DjVu 文件。它与 tesseract、ocropus、cuneiform 等工具协同工作。
免费 • 开源
查看详情Scan Thing 是捕捉并保存周围任何内容的最快方式。Scan Thing 已在 iOS、iPadOS 和 macOS 上提供。
免费增值 • 专有
查看详情