相关 Google Cloud 产品

以下产品与 Document AI 共享功能。不过,这些产品会执行特定的文本和分析功能。根据您的使用场景,这些产品可能提供您所需的特定功能。

将图片转换成文字

您可以使用以下任一方法将图片中的内容转换为文本:

检测视觉伪影

您可以使用 AutoML Vision 对象检测将图片的某些部分转换为文本文档。如需了解详情,请参阅图片数据

对文档进行分类

在预先运行文档纯文本和 OCR 后,您可以使用以下产品对文档进行分类和标记:

  • 预训练的 Natural Language API 可帮助您使用概括性类别列表对内容进行分类。
  • 使用 AutoML Natural Language 分类功能创建自定义机器学习模型,并使用您自己的类别标签对内容进行分类。
  • 虽然可能存在例外情况,但通常不建议将 AutoML Vision 分类用于文档分类,因为其准确性往往不如基于文本的方法。不过,您可以使用它来对图片内容进行分类。

    • 通常,我们不建议使用此方法对文档进行分类,因为其准确性通常不如基于文本的方法,但也可能存在例外情况
Natural Language API
AutoML Natural Language 分类
AutoML Vision 分类

分析和提取实体

您可以根据自己的用例,使用表单解析器或任何预训练处理器来识别文档中的已知实体(公众人物、公司品牌等专有名词)以及遵循常见模式的实体(例如手机号码和地址)。

  • 您还可以使用 Natural Language API 识别常见的公共实体。
  • AutoML Natural Language 产品用于实体提取。您可以使用这些数据创建自定义机器学习模型,以识别特定于贵公司或使用情形的实体。
Natural Language API
AutoML Natural Language 实体提取

其他产品

将这些互补产品与 Document AI 集成,打造完整的文档处理和分析解决方案。

  • Vertex AI:将 AutoML 和 AI Platform 整合到统一的 API、客户端库和平台中。
  • Cloud Translation API:通过预训练模型在数以千计的语言对之间动态翻译文本。提供了一个文档翻译 API,用于直接翻译 PDF 和 DOCX 等格式的文档。请参阅翻译文档
  • 工作流:结合使用 Google Cloud 服务和 API 来构建可靠的应用、流程自动化以及数据和机器学习流水线。
  • AppSheet Automation:利用开放式云创建自定义自动化流程和应用。
  • Google 云端硬盘的云端硬盘扫描器:借助 Google 云端硬盘 Android 应用,您可以扫描文档并将其上传到 Google 云端硬盘,还可以获得由 Document AI 提供支持的智能标题建议。
  • Google 翻译:这项服务可提供英语和另外 100 多种语言之间的互译功能,可让您即时翻译字词、短语和网页内容。

寻找合作伙伴

借助我们不断发展壮大的合作伙伴生态系统,您可以创建和管理文档分析解决方案。如需查看合作伙伴及其提供的服务的列表,请参阅 Document AI 合作伙伴

后续步骤

  • 了解如何设置 Document AI。
  • 方法中查找特定指南。