docext

docext
软件
软件描述
docext 是一个强大的工具,可用于从发票、护照及其他表格类文档中提取结构化信息。它利用视觉语言模型(VLM)准确识别并提取文档图像中的字段数据和表格信息。
官方网站
访问软件的官方网站了解更多信息
github.com
安全链接HTTPS
什么是 docext?
docext 是一款强大的工具,可用于从发票、护照及其他表格类文档中提取结构化信息。它利用视觉语言模型(VLM)准确识别并提取文档图像中的字段数据和表格信息。
特性:
用户友好的界面:基于 Gradio 构建,便于文档处理
灵活提取:可自定义字段或使用预设模板
表格提取:从文档中提取结构化表格数据
置信度评分:获取提取信息的置信度水平
本地部署:完全在自有基础设施上运行
多页支持:可处理多页文档
REST API:提供程序化接口,便于与应用集成
预设模板:提供常见文档类型的即用型模板:
发票
护照
可为其他模板添加/删除字段/列。
