Tesseract

Tesseract
软件描述
Tesseract.js 是一个 JavaScript 库,可从图像中提取几乎任何语言的文本。
官方网站
访问软件的官方网站了解更多信息
github.com
什么是 Tesseract?
Tesseract.js 是一个 JavaScript 库,可以从图像中提取几乎任何语言的文本。Tesseract OCR 引擎在 1995 年 UNLV 准确性测试中位列前三。1995 年至 2006 年间其开发进展缓慢,但至今仍是可用的最准确的开源 OCR 引擎之一。该源代码可读取二值、灰度或彩色图像并输出文本。内置 TIFF 读取器可处理未压缩的 TIFF 图像,也可添加 libtiff 以读取压缩图像。它支持多种语言的语言文件,甚至包括使用弗拉克图尔体和黑体字形的文字。
主要功能
🔄 替代方案
22 个选择OSS 文档扫描仪是一款开源应用程序,用于扫描您的所有文档。您可以使用相机进行扫描,或导入图像。该应用将自动检测照片中的文档并裁剪图像。
光学识别软件具备无与伦比的文本准确率,可将扫描文档转换为可编辑的Word、Excel或可搜索的PDF文件,同时保留原有版式。支持190种语言,通过自动化任务简化流程,并内置PDF编辑工具。

gscan2pdf
gscan2pdf 可以扫描、清理扫描件,并对扫描件或导入的图像(包括现有的 PDF、DjVu 或其他文件类型)进行 OCR,生成包含嵌入式 OCR 文本的 PDF 和 DjVu 文件。它可与 tesseract、ocropus、cuneiform 等工具配合使用。

Open Scanner
Open Scanner 是一款快速且易于使用的纸质扫描应用,具备人工智能功能,可加速您的扫描工作流程:

OwlOCR
OwlOCR 提供对 PDF 文件、图像或屏幕上的文本进行简单的光学字符识别,并将其转换为纯文本。

EasyOCR
支持80多种语言和所有主流书写系统(包括拉丁文、中文、阿拉伯文、天城文、西里尔文等)的即用型OCR。
Scan Thing 是快速捕捉并保存您周围任何物品的最便捷方式。Scan Thing 支持 iOS、iPadOS 和 macOS。




