从 v1Beta2 迁移

Document AI 的 v1beta2 API 现已废弃,取而代之的是 v1 API。

v1beta2 不同,Document AI v1 是有状态的 API,这意味着您需要先创建 Processor,然后才能向 ProcessBatchProcess 文档发送请求。

注意:此弃用仅影响用于调用任何处理器的 API 版本。这不会影响任何处理器的可用性。

本文档稍后将讨论 v1 API 与 v1beta2 API 之间不向后兼容的主要方面。

创建处理器

如需迁移到 v1 以创建处理器,请先创建 Processor。下表可作为选择适当的 ProcessorType 来创建的一般指南,但您也可以参阅完整的处理器列表

document_type params 处理器类型
invoice INVOICE_PROCESSOR
general OCR_PROCESSOR
general table_extraction_params FORM_PARSER_PROCESSOR
general form_extraction_params FORM_PARSER_PROCESSOR
general entity_extraction_params FORM_PARSER_PROCESSOR
general automl_params CUSTOM_EXTRACTION_PROCESSOR

如需查看创建处理器的分步指南,请参阅指南

正在处理文档

Document AI v1 有两个用于接受文档的 API:ProcessBatchProcess。 这些方法中的每一种都对应于 v1beta2 中的一种方法。下面重点介绍了这些方法及其区别:

v1beta2 方法 v1 方法 迁移注意事项
ProcessDocument Process InputConfig.Cloud Storage_sourcev1 中不受支持,请使用 BatchProcess 处理 Cloud Storage 中的文档。
BatchProcessDocuments BatchProcess 除了接受 Cloud Storage 中的单个文档之外,v1 还支持 Cloud Storage 前缀,以便一次处理多个文档。

客户端库

如果使用 Client Libraries 与 Document AI 交互,请从使用 DocumentUnderstandingService 改为使用 DocumentProcessorService。如需查看有关如何使用 v1 的客户端库的详细示例,请参阅客户端库