从 v1Beta2 迁移
Document AI 的 v1beta2
API 现已废弃,取而代之的是 v1
API。
与 v1beta2
不同,Document AI v1
是一个有状态的 API,这意味着您需要先创建 Processor
,然后才能向 Process
和 BatchProcess
文档发送请求。
注意:此弃用仅会影响用于调用任何处理器的 API 版本。这不会影响任何处理器的供应情况。
本文档稍后会讨论 v1 API 与 v1beta2 API 在哪些主要方面不向后兼容。
创建处理器
如需迁移到 v1
以创建处理器,请先创建 Processor
。下表可作为选择要创建的适当 ProcessorType
的一般准则,但您也可以参阅完整的处理器列表。
document_type |
params |
处理器类型 |
---|---|---|
invoice |
INVOICE_PROCESSOR |
|
general |
OCR_PROCESSOR |
|
general |
table_extraction_params |
FORM_PARSER_PROCESSOR |
general |
form_extraction_params |
FORM_PARSER_PROCESSOR |
general |
entity_extraction_params |
FORM_PARSER_PROCESSOR |
general |
automl_params |
CUSTOM_EXTRACTION_PROCESSOR |
如需查看有关创建处理器的分步指南,请参阅指南。
正在处理文档
Document AI v1
有两个用于接受文档的 API:Process
和 BatchProcess
。
这些方法中的每种方法都对应于 v1beta2
中的方法。下面突出显示了这些方法及其差异:
v1beta2 方法 |
v1 方法 |
迁移注意事项 |
---|---|---|
ProcessDocument |
Process |
v1 不支持 InputConfig.Cloud Storage_source ,请使用 BatchProcess 处理 Cloud Storage 中的文档。 |
BatchProcessDocuments |
BatchProcess |
除了接受 Cloud Storage 上的个别文档之外,v1 还支持 Cloud Storage 前缀,以便一次处理多个文档。 |
客户端库
如果使用 Client Libraries
与 Document AI 交互,请改用 DocumentProcessorService
而非 DocumentUnderstandingService
。如需有关使用 v1
客户端库的详细示例,请参阅客户端库。