以下产品与 Document AI 共享功能。不过,这些产品会执行特定的文本和分析功能。根据您的使用场景,这些产品可能提供您所需的特定功能。
将图片转换成文字
您可以使用以下任一方法将图片中的内容转换为文本:
- Enterprise Document OCR。
Cloud Vision API(使用
TEXT_DETECTION
或DOCUMENT_TEXT_DETECTION
枚举)。请参阅:
检测视觉伪影
您可以使用 AutoML Vision 对象检测将图片的某些部分转换为文本文档。如需了解详情,请参阅图片数据。
对文档进行分类
在预先运行文档纯文本和 OCR 后,您可以使用以下产品对文档进行分类和标记:
- 预训练的 Natural Language API 可帮助您使用概括性类别列表对内容进行分类。
- 使用 AutoML Natural Language 分类功能创建自定义机器学习模型,并使用您自己的类别标签对内容进行分类。
虽然可能存在例外情况,但通常不建议将 AutoML Vision 分类用于文档分类,因为其准确性往往不如基于文本的方法。不过,您可以使用它来对图片内容进行分类。
- 通常,我们不建议使用此方法对文档进行分类,因为其准确性通常不如基于文本的方法,但也可能存在例外情况
Natural Language API | |
AutoML Natural Language 分类 | |
AutoML Vision 分类 |
分析和提取实体
您可以根据自己的用例,使用表单解析器或任何预训练处理器来识别文档中的已知实体(公众人物、公司品牌等专有名词)以及遵循常见模式的实体(例如手机号码和地址)。
- 您还可以使用 Natural Language API 识别常见的公共实体。
- AutoML Natural Language 产品用于实体提取。您可以使用这些数据创建自定义机器学习模型,以识别特定于贵公司或使用情形的实体。
Natural Language API | |
AutoML Natural Language 实体提取 |
其他产品
将这些互补产品与 Document AI 集成,打造完整的文档处理和分析解决方案。
- Vertex AI:将 AutoML 和 AI Platform 整合到统一的 API、客户端库和平台中。
- Cloud Translation API:通过预训练模型在数以千计的语言对之间动态翻译文本。提供了一个文档翻译 API,用于直接翻译 PDF 和 DOCX 等格式的文档。请参阅翻译文档。
- 工作流:结合使用 Google Cloud 服务和 API 来构建可靠的应用、流程自动化以及数据和机器学习流水线。
- AppSheet Automation:利用开放式云创建自定义自动化流程和应用。
- Google 云端硬盘的云端硬盘扫描器:借助 Google 云端硬盘 Android 应用,您可以扫描文档并将其上传到 Google 云端硬盘,还可以获得由 Document AI 提供支持的智能标题建议。
- Google 翻译:这项服务可提供英语和另外 100 多种语言之间的互译功能,可让您即时翻译字词、短语和网页内容。
寻找合作伙伴
借助我们不断发展壮大的合作伙伴生态系统,您可以创建和管理文档分析解决方案。如需查看合作伙伴及其提供的服务的列表,请参阅 Document AI 合作伙伴。