Document AI 自定义提取器现已正式发布!试看下面的演示

跳转到
Vertex AI 的文档处理解决方案

Document AI

创建文档处理器,帮助自动执行繁琐的任务、改进数据提取功能,并从非结构化或结构化文档信息中获得更深入的数据洞见。Document AI 可帮助开发者创建高准确率处理器,用于对文档进行提取、分类和拆分。

  • 使用生成式 AI 在几分钟内提取数据并设计其结构

  • 无缝连接到 BigQuery、Vertex Search 和其他 Google Cloud 产品

  • 企业级,以及 Google Cloud 在数据安全和隐私保护方面的承诺

  • 专为开发者打造;使用界面或 API 轻松创建文档处理器

优势

更快实现价值

使用生成式 AI 提取数据或对文档进行分类,无需任何训练即可开始使用。只需将文档发布到企业级 API 端点,即可获得结构化数据。

准确率更高

Document AI 由最新的基础模型提供支持,针对文档任务进行了优化。此外,借助强大的微调和自动添加标签功能,该平台还提供了多种途径来达到所需的准确率。

更明智的决策

使用生成式 AI 构建并数字化文档中的信息,从而获取更深入的数据洞见,帮助企业做出更明智的决策。

演示

在您的环境中试用 Document AI

使用生成式 AI 从文档中提取数据。如需了解完整的产品功能,请访问 Google Cloud 控制台中的 Document AI

主要特性

使用生成式 AI 进行文档处理

Document AI Workbench

Document AI Workbench 提供了一种构建自定义处理器的简单方法,用于对文档中的结构化数据进行分类、拆分和提取。Workbench 由生成式 AI 提供支持,这意味着开箱即可使用,从而在众多文档中获得准确的结果。此外,只需提供 10 个文档来对大型模型进行微调,即可实现更高的准确度 - 只需点击一个按钮或调用 API 即可实现。

立即试用或了解详情

企业 OCR

借助 Enterprise Document OCR,用户可以利用 Google 25 年的光学字符识别 (OCR) 研究成果。OCR 由在商业文档上训练的模型提供支持,可以检测 PDF 文件中的文本以及 200 多种语言的扫描文档图片。该产品可以查看文档的结构,以识别文本块、段落、行、字词和符号等布局特征。高级功能包括一流的手写识别功能(50 种语言)、识别数学公式、检测字体样式信息以及提取复选框和单选按钮等选择标记。

建议您立即试用 Document OCR,以提取准确的文本和布局。

表单解析器

开发者使用 Form Parser 可从标准表单中获取字段和值,提取一般实体(包括名称、地址和价格),并构建表格中包含的数据。此产品开箱即用,无需任何培训或自定义,可用于各种文档自定义。

探索使用 Form Parser 处理文档。

预先训练

试用适用于常用文档类型(包括 W2、工资条、银行对账单、账单、费用、美国驾照、美国护照和身份证明)的预训练模型。

处理器库中探索预训练选项。

文档

文档

Google Cloud Basics

Document AI 概览

简要了解 Document AI 的基础知识,包括从文档中提取文本、对文档进行分类以及提取实体。
Tutorial

Document AI 简介视频和实验

通过我们的视频系列《文档未来》和分步 Codelab 开始了解 Document AI。
Quickstart

设置 Document AI API

本指南介绍了开始使用 Document AI 所需的所有设置步骤。

没有看到您需要的内容?

使用场景

使用场景

使用场景
提取数据,实现自动化和分析

使用 Document AI Workbench 从文档中提取结构化数据,从而自动输入数据。典型的应用包括邮局、装运站、抵押贷款处理部门、采购等。您可以利用这些数据做出更高效、更有效的业务决策。

试用自定义提取器

使用场景
使用 BigQuery 发掘隐含在文档中的数据洞见

您现在可以将文档中的元数据直接提取到 BigQuery 对象表中。将解析后的数据与其他 BigQuery 表无缝联接,将结构化和非结构化数据组合在一起,为全面的文档分析铺平道路。

如需详细了解 BigQuery 和 Document AI 集成,请点击此处

使用场景
对文档进行分类

在文档流入业务流程时为文档分配类别或类,使文档更易于管理、搜索、过滤或分析。自定义拆分器和分类器使用机器学习来准确预测一个文件中的单个文档或多个文档并对其进行分类。使用这些产品可以提高文档流程的效率。

了解详情并试用自定义拆分器和自定义分类器

使用场景
打造更智能的文档处理应用

SaaS 客户和 ISV 合作伙伴可以利用生成式 AI 快速改进和扩展其文档处理解决方案。借助简单的 API 预测端点和文档响应格式,客户可以将文档应用提升到新的水平。

使用场景
将文本数字化以训练机器学习模型

借助 Enterprise Document OCR,用户可以从无法用于训练机器学习模型的归档内容中创造价值。OCR 有助于从扫描的文档、图表、报告和演示文稿中提取文本,然后保存到云端存储空间或数据仓库。使用这些高质量的 OCR 输出,您可以加快数字化转型计划,例如训练特定于您的业务的机器学习模型。

使用场景
利用生成式 AI 拓展业务能力

捕获新的生成式 AI 架构和框架的文档信息。通过将 OCR 和 Vertex AI PaLM API 相结合,用户可以从文档中挖掘有价值的数据,从而打造文档问答体验、执行自动文档比较,甚至生成新的文档。   

价格

Document AI 价格

Document AI 提供透明、经济高效的价格方案,满足您的所有文档处理、模型训练和存储需求。如需了解详情,请访问我们的价格页面

如果您使用非美元货币付费,请参阅 Google Cloud SKU 上以您的币种列出的价格。

合作伙伴

Document AI 合作伙伴

携手这些值得信赖的合作伙伴,获得 Document AI 实现方面的帮助。 查看完整合作伙伴目录


Cloud AI 产品遵循我们的服务等级协议 (SLA) 政策。这些产品在延迟时间或可用性方面的保证可能与其他 Google Cloud 服务有所不同。

更进一步

获享 $300 赠金以及 20 多种提供“始终免费”用量的产品,开始在 Google Cloud 上构建项目。

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
控制台
  • 利用我们透明的定价方法节省资金
  • Google Cloud 的随用随付价格方案会根据预付费资源的每月用量和折扣费率自动为您节省费用。请立即联系我们,获取报价。
Google Cloud