从 v1Beta2 迁移

Document AI 的 v1beta2 API 现已废弃,取而代之的是 v1 API。

v1beta2 不同,Document AI v1 是一个有状态的 API,这意味着您需要先创建 Processor,然后才能向 ProcessBatchProcess 文档发送请求。

注意:此弃用仅会影响用于调用任何处理器的 API 版本。这不会影响任何处理器的供应情况。

本文档稍后会讨论 v1 API 与 v1beta2 API 在哪些主要方面不向后兼容。

创建处理器

如需迁移到 v1 以创建处理器,请先创建 Processor。下表可作为选择要创建的适当 ProcessorType 的一般准则,但您也可以参阅完整的处理器列表

document_type params 处理器类型
invoice INVOICE_PROCESSOR
general OCR_PROCESSOR
general table_extraction_params FORM_PARSER_PROCESSOR
general form_extraction_params FORM_PARSER_PROCESSOR
general entity_extraction_params FORM_PARSER_PROCESSOR
general automl_params CUSTOM_EXTRACTION_PROCESSOR

如需查看有关创建处理器的分步指南,请参阅指南

正在处理文档

Document AI v1 有两个用于接受文档的 API:ProcessBatchProcess。 这些方法中的每种方法都对应于 v1beta2 中的方法。下面突出显示了这些方法及其差异:

v1beta2 方法 v1 方法 迁移注意事项
ProcessDocument Process v1 不支持 InputConfig.Cloud Storage_source,请使用 BatchProcess 处理 Cloud Storage 中的文档。
BatchProcessDocuments BatchProcess 除了接受 Cloud Storage 上的个别文档之外,v1 还支持 Cloud Storage 前缀,以便一次处理多个文档。

客户端库

如果使用 Client Libraries 与 Document AI 交互,请改用 DocumentProcessorService 而非 DocumentUnderstandingService。如需有关使用 v1 客户端库的详细示例,请参阅客户端库