CuneiForm

CuneiForm
软件描述
楔形文字(OpenOCR)是一款用于印刷模板的文本识别软件。该程序无法识别手稿或PDF文件,但可以识别表格结构。语言模型支持20种语言,识别结果可保存为HTML、RTF或ASCII文本格式,或……
官方网站
访问软件的官方网站了解更多信息
launchpad.net
什么是 CuneiForm?
CuneiForm(OpenOCR)是一款用于识别打印模板的文本识别软件。该程序无法识别手稿或PDF文件,但可识别表格结构。语言模型支持20种语言,识别结果可保存为HTML、RTF或ASCII文本格式,也可直接导出至Word或Excel。字体及文档结构保持不变。
CuneiForm最近才开放源代码,由俄罗斯公司Cognitive Technologies开发,其名称意为“楔形文字”(英文cuneiform意为“楔形”)。
自2008年4月起才允许商业使用,因为源代码自2008年起才公开。Jussi Pakkanen提供了CuneiForm的便携版。支持的操作系统包括Linux、BSD、Mac OS X和Windows。
支持20种语言:英语、德语、法语、西班牙语、意大利语、葡萄牙语、荷兰语、俄语、俄英混合语、乌克兰语、丹麦语、瑞典语、芬兰语、塞尔维亚语、克罗地亚语、波兰语及其他语言。
🔄 替代方案
82 个选择该应用的核心功能是通过意图(intent)或选择器(chooser)直接扫描或选择已有的PDF文档。其他应用要么需要付费才能使用其API/SDK,要么根本没有可行的方法实现这一功能,因此它们只能在应用程序、文件选择器和扫描功能之间反复切换。
OCR软件和网络服务,可从图像文件和PDF中提取文本。该应用可作为在线OCR网页应用、OCR API或简单安装的Windows商店应用使用。

FreeOCR
软件
FreeOCR 是一个扫描和光学字符识别(OCR)程序,包含免费的 Tesseract OCR 引擎,也被称为 Tesseract 图形用户界面(GUI)。该程序包含 Windows 安装程序,使用非常简便。