Tesseract

软件描述

Tesseract.js 是一个 JavaScript 库,可以从图像中提取几乎所有语言的文本。

官方网站

访问软件的官方网站了解更多信息

官方认证

github.com

安全链接HTTPS

什么是 Tesseract?

Tesseract.js 是一个能够从图像中提取几乎所有语言文字的 JavaScript 库。Tesseract OCR 引擎曾在1995年联合国立大学(UNLV)准确率测试中位列前三。1995年至2006年间,该引擎几乎未进行任何改进,但如今它可能是最准确的开源 OCR 引擎之一。其源代码能够读取二值、灰度或彩色图像,并输出文字内容。内置了 TIFF 读取器,可读取未压缩的 TIFF 图像,也可通过添加 libtiff 库来支持压缩图像的读取。该库提供了多种语言的字典文件,甚至包括使用 Fraktur 和黑体字体排版的文本。

🔄 替代方案

22 个选择
4.6

OSS文档扫描器是一款开源应用程序,可扫描您所有的文档。您可以使用相机进行扫描,也可以导入图片。该应用程序会自动在照片中识别文档,并对图片进行裁剪。

免费 • 开源
查看详情
4.2

文本识别软件具备无与伦比的文本准确性,可将扫描文档转换为可编辑的Word、Excel文件或可搜索的PDF文件,同时保留原始排版。支持190种语言,通过自动化任务简化操作流程,并内置PDF编辑工具。

付费 • 专有
查看详情
4.8

gscan2pdf 可以进行扫描、清理扫描图像,并对扫描图像或导入的图像(包括现有 PDF、DjVu 或其他文件类型)执行 OCR 处理,生成包含嵌入 OCR 文本的 PDF 和 DjVu 文件。它与 tesseract、ocropus、cuneiform 等工具协同工作。

免费 • 开源
查看详情
Open Scanner

Open Scanner

文档扫描仪

Open Scanner 是一款快速且易于使用的纸张扫描应用,具备人工智能功能,可加快您的扫描工作流程:

免费 • 开源
查看详情

OwlOCR 可对 PDF 文件、图片或屏幕上的文本进行简单的光学字符识别,并将其转换为纯文本。

免费增值 • 专有
查看详情

支持80多种语言和所有主流书写系统(包括拉丁文、中文、阿拉伯文、天城文、西里尔文等)的即用型光学字符识别(OCR)功能。

免费 • 开源
查看详情
Scan Thing: Scan Anything

Scan Thing: Scan Anything

文档扫描仪, 图像扫描仪

Scan Thing 是捕捉并保存周围任何内容的最快方式。Scan Thing 已在 iOS、iPadOS 和 macOS 上提供。

免费增值 • 专有
查看详情

DocHorizon 是一个基于人工智能的文档处理平台,可实现数据提取、欺诈检测、身份验证、匿名化和电子发票的自动化。

付费 • 专有
查看详情
上一页
下一页
评分4 / 5.0

支持平台

下载与相关链接

安全提示
⚠️

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。