管理处理器版本
发布新版本的原因有很多,例如提高准确性、提高可用性以及支持新的文档元素(例如选择标记)。
鉴于 Document AI 由生成式 AI 提供支持,未来的版本将使用新的基础模型,以便您受益于生成式 AI 增强功能。
随着我们改进基础模型,较早的基础模型会被弃用。同样,处理器版本会在新版本发布六个月后被弃用。
处理器可以具有以下版本之一:
本页面介绍了如何对处理器进行版本控制,以及如何查看和选择特定版本。
处理器版本概览
处理器版本分为两类:
- Google 版本可以是稳定版(用于生产用例),也可以是候选版本(实验版,包含最新功能)。
- 用户版本由您创建,用于自定义文档的预测结果,并具有字母数字版本 ID。
Google 版本
每个 Google 版本都由一个版本 ID 标识,例如 pretrained-TYPE-vX.X-YYYY-MM-DD
。
Google 提供的每个处理器版本都命名为 Google Stable 或 Google Release Candidate (RC)。
Google 稳定版
稳定版本的质量达到了生产环境要求,并且已准备好供用户使用。
- Google 会优先考虑处理器行为的稳定性,但仍会纳入重要补丁。
- 如图所示,较早的 Google 稳定版会在最新稳定版发布六个月后被弃用。
Google 候选版本 (RC)
候选版本是实验性版本,会定期升级以提供最新功能。这些版本不符合生产环境质量要求,其稳定性可能会有所不同。
自定义版本
自定义版本是指您可以根据文档创建的处理器版本,用于自定义预测。
自定义版本具有 Type
,用于显示预测所用的模型类型。如果您使用基础模型创建版本(通过创建版本或进行微调),则类型为 Generative AI。如果您通过训练较小的自定义模型(基于模型或模板)来创建处理器版本,则类型为自定义。如果您创建处理器版本,则可以自行决定名称和 ID。
基础版本
如果您创建处理器版本,“基础版本”会显示您的自定义用户版本由哪个 Google 版本提供支持。基础版本决定了用户版本的生命周期。 您需要决定如何管理自定义用户版本的生命周期。
可用的稳定处理器版本
自定义提取器 | 发布日期 | 弃用日期 |
---|---|---|
pretrained-foundation-model-v1.3-2024-08-31 | 2024 年 5 月 28 日 | 2025 年 9 月 24 日 |
pretrained-foundation-model-v1.2-2024-05-10 | 2024 年 5 月 28 日 | 2025 年 9 月 24 日 |
银行对账单 | 发布日期 | 弃用日期 |
---|---|---|
pretrained-bankstatement-v3.0-2022-05-16 | 2022 年 5 月 16 日 | 不适用 |
pretrained-bankstatement-v2.0-2021-12-10 | 2021 年 12 月 10 日 | 不适用 |
pretrained-bankstatement-v1.1-2021-08-13 | 2021 年 8 月 13 日 | 不适用 |
pretrained-bankstatement-v1.0-2021-08-08 | 2021 年 8 月 8 日 | 不适用 |
费用 | 发布日期 | 弃用日期 |
---|---|---|
pretrained-expense-v1.3-2022-07-15 | 2022 年 7 月 15 日 | 将于 2025 年 4 月 30 日起在美国 (US) 和欧盟 (EU) 停用。 |
pretrained-expense-v1.2-2022-02-18 | 2022 年 2 月 18 日 | 将于 2025 年 4 月 30 日起在美国 (US) 和欧盟 (EU) 停用。 |
pretrained-expense-v1.1-2021-04-09 | 2021 年 4 月 9 日 | 不适用 |
身份验证 | 发布日期 | 弃用日期 |
---|---|---|
pretrained-id-proofing-v1.0-2022-10-03 | 2022 年 10 月 3 日 | 不适用 |
账单 | 发布日期 | 弃用日期 |
---|---|---|
pretrained-账单-v1.3-2022-07-15 | 2022 年 7 月 15 日 | 不适用 |
pretrained-账单-v1.2-2022-02-18 | 2022 年 2 月 18 日 | 不适用 |
pretrained-账单-v1.1-2021-04-09 | 2021 年 4 月 9 日 | 不适用 |
美国驾照 | 发布日期 | 弃用日期 |
---|---|---|
pretrained-us-driver-license-v1.0-2021-06-14 | 2021 年 6 月 14 日 | 不适用 |
美国护照 | 发布日期 | 弃用日期 |
---|---|---|
pretrained-us-passport-v1.0-2021-06-14 | 2021 年 6 月 14 日 | 不适用 |
工资单 | 发布日期 | 弃用日期 |
---|---|---|
pretrained-paystub-v2.0-2022-07-22 | 2022 年 7 月 22 日 | 不适用 |
pretrained-paystub-v1.2-2021-12-10 | 2021 年 12 月 10 日 | 不适用 |
pretrained-paystub-v1.1-2021-08-13 | 2021 年 8 月 13 日 | 不适用 |
pretrained-paystub-v1.0-2021-03-19 | 2021 年 3 月 19 日 | 不适用 |
W2 | 发布日期 | 弃用日期 |
---|---|---|
pretrained-w2-v2.1-2022-06-08 | 2022 年 6 月 8 日 | 不适用 |
pretrained-w2-v1.2-2022-01-28 | 2022 年 1 月 28 日 | 不适用 |
pretrained-w2-v1.1-2022-01-27 | 2022 年 1 月 27 日 | 2024 年 3 月 31 日 |
pretrained-w2-v1.0-2020-10-01 | 2020 年 10 月 1 日 | 2024 年 3 月 31 日 |
处理器版本生命周期
一旦有新的 Google 版本可用,您就应该使用新的基本版本创建并评估新的用户版本。然后,部署新版本并取消部署(或删除)以之前的稳定版为基础的早期用户版本。在发布新的稳定版后,旧的稳定版会停止更新。 如果出现这种情况,Google 会至少提前六个月通知您。
当基本版本被弃用时会发生什么情况?
依赖于较早基本版本的用户版本在基本版本被弃用后将停止返回预测结果。
系统如何为您的请求选择处理器版本?
如果您在调用处理器端点时未指定处理器版本,系统会使用默认处理器版本。当默认处理器版本发生变化时,您可能需要更新代码。
使用的端点 | 经验 |
---|---|
如果您未指定处理器版本 ID | 使用新的默认处理器版本处理的请求。 如果您的默认处理器版本已弃用,则在较旧的默认版本弃用时,默认版本会更新为最近发布的稳定版 Google 版本。 |
如果您指定了处理器版本 ID | 如果您调用处理器端点并指定已弃用的版本 ID,则响应会失败。 |
自定义版本的弃用示例
请考虑以下场景,该场景描述了自定义版本弃用过程中的事件序列:
作为开发者,您正在使用自定义提取器从文档中获取数据。鉴于您处理的文档的复杂性和数量,您对基础模型进行了微调,以创建名为
fine-tune-A
的版本。您将fine-tune-A
版本设置为处理器的默认版本,并使用该版本来处理文档。为fine-tune-A
模型提供支持的基本版本是pretrained-foundation-model-v1.0-2023-08-22 (v1.0)
稳定版。Google 发布了名为
pretrained-foundation-model-v1.2-2024-05-10 (v1.2)
的新稳定版,并宣布v1.0
稳定版将于 2025 年 4 月 9 日弃用。由于您将训练文档和测试文档保留在处理器的数据集中,因此您基于最新的 Google 稳定版
v1.2
对另一个版本进行微调,并将其命名为fine-tune-B
。评估其性能后,您将fine-tune-B
版本设置为处理器的新的默认版本,并停用fine-tune-A
版本。新版本现在使用受支持的最新 Google 稳定版。
另一方面,如果您没有创建和评估自定义的 fine-tune-B
版本,Google 将于 2025 年 4 月 9 日将处理器的默认版本更新为 v1.2
。由于您调用的是处理器的端点,并且未指定处理器版本,因此新的 v1.2
版本将用作新的默认版本来处理您的请求。
弃用和迁移资源
对于已弃用的解析器和处理器,您可以参阅 Document AI 弃用。
如需了解迁移,请参阅以下资源:
如需创建和训练新的费用解析器,您可以参阅更新预训练的处理器。
如需了解如何创建和调整新的自定义提取器处理器,您可以参阅使用生成式 AI 的自定义提取器。
选择处理器版本
您可以通过以下三种方式指定用于在线处理和批处理的处理器版本:
如果您未指定版本,则使用处理器的默认版本。
- 示例:
projects/my-proj/locations/us/processors/my-processor:process
- 示例:
如果您指定了版本,则系统会使用该特定版本。如果特定版本不存在,请求会失败并显示错误。
- 例如:
projects/my-proj/locations/us/processors/my-processor/processorVersions/pretrained-invoice-v1.2-2022-02-18:process
- 例如:
如果您指定渠道,则系统会使用该渠道中的最新版本。(选项:
stable
、rc
)- 例如:
projects/my-proj/locations/us/processors/my-processor/processorVersions/stable:process
- 例如:
查看可用版本
控制台
在 Google Cloud 控制台的 Document AI 部分,前往处理器页面。
在处理器列表中,点击要查看其详细信息的处理器的名称。
选择管理版本(或部署和使用)标签页,其中会显示所有可用的处理器版本。
REST
此示例展示了如何使用 processorVersions.list
方法列出处理器的可用处理器版本。
在使用任何请求数据之前,请先进行以下替换:
- LOCATION:处理器的位置,例如:
us
- 美国eu
- 欧盟
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROCESSOR_ID:自定义处理器的 ID。
HTTP 方法和网址:
GET https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions
如需发送请求,请选择以下方式之一:
curl
执行以下命令:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions"
PowerShell
执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions" | Select-Object -Expand Content
响应包含 ProcessorVersions
的列表,其中包含有关每个处理器版本的信息,例如其 name
、state
和其他详细信息。
{ "processorVersions": [ { "name": "projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/pretrained-ocr-v1.1-2022-09-12", "displayName": "Google Release Candidate", "state": "DEPLOYED", "createTime": "2022-09-13T23:39:12.156648Z", "googleManaged": true }, { "name": "projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/pretrained-ocr-v1.0-2020-09-23", "displayName": "Google Stable", "state": "DEPLOYED", "createTime": "2022-09-12T23:35:09.829557Z", "googleManaged": true, "deprecationInfo": { "deprecationTime": "1970-01-01T00:00:00Z" } } ] }
C#
如需了解详情,请参阅 Document AI C# API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Go
如需了解详情,请参阅 Document AI Go API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解详情,请参阅 Document AI Java API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解详情,请参阅 Document AI Python API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Ruby
如需了解详情,请参阅 Document AI Ruby API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
查看版本的详细信息
控制台
在 Google Cloud 控制台的 Document AI 部分,前往处理器页面。
在处理器列表中,点击要查看其详细信息的处理器的名称。
选择管理版本(或部署和使用)标签页,其中会显示所有可用的处理器版本及其详细信息。
REST
此示例展示了如何使用 processorVersions.get
方法获取处理器的处理器版本详细信息。
在使用任何请求数据之前,请先进行以下替换:
- LOCATION:处理器的位置,例如:
us
- 美国eu
- 欧盟
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROCESSOR_ID:自定义处理器的 ID。
- PROCESSOR_VERSION:处理器版本标识符。如需了解详情,请参阅选择处理方版本。例如:
pretrained-TYPE-vX.X-YYYY-MM-DD
stable
rc
HTTP 方法和网址:
GET https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION
如需发送请求,请选择以下方式之一:
curl
执行以下命令:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION"
PowerShell
执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION" | Select-Object -Expand Content
响应是一个 ProcessorVersion
,其中包含有关处理器版本的信息,例如其 name
、state
和其他详细信息。
{ "name": "projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/pretrained-ocr-v1.1-2022-09-12", "displayName": "Google Release Candidate", "state": "DEPLOYED", "createTime": "2022-09-13T23:39:12.156648Z", "googleManaged": true }
C#
如需了解详情,请参阅 Document AI C# API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Go
如需了解详情,请参阅 Document AI Go API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解详情,请参阅 Document AI Java API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解详情,请参阅 Document AI Python API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Ruby
如需了解详情,请参阅 Document AI Ruby API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
更改默认版本
处理器的默认版本用于指定在您未指定特定版本时处理文档所用的版本。创建处理器时,初始默认版本是稳定渠道中的最新版本。
如果您更改默认版本,系统会使用新选择的版本处理传入的请求。如果您在处理器正在处理请求的过程中更改默认版本,则该请求将继续使用之前选择的版本。
如需更改默认版本,请执行以下操作:
控制台
在 Google Cloud 控制台的 Document AI 部分,前往处理器页面。
在处理器列表中,点击要查看其详细信息的处理器的名称。
在处理器的管理版本(或部署和使用)标签页中,从默认版本下拉菜单中选择要用作默认版本的处理器版本。
REST
此示例展示了如何使用 processors.setDefaultProcessorVersion
方法为处理器设置默认处理器版本。
在使用任何请求数据之前,请先进行以下替换:
- LOCATION:处理器的位置,例如:
us
- 美国eu
- 欧盟
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROCESSOR_ID:自定义处理器的 ID。
- PROCESSOR_VERSION:处理器版本标识符。如需了解详情,请参阅选择处理方版本。例如:
pretrained-TYPE-vX.X-YYYY-MM-DD
stable
rc
HTTP 方法和网址:
POST https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID:setDefaultProcessorVersion
请求 JSON 正文:
{ "defaultProcessorVersion": "PROCESSOR_VERSION" }
如需发送请求,请选择以下方式之一:
curl
将请求正文保存在名为 request.json
的文件中,然后执行以下命令:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID:setDefaultProcessorVersion"
PowerShell
将请求正文保存在名为 request.json
的文件中,然后执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID:setDefaultProcessorVersion" | Select-Object -Expand Content
该响应是一个长时间运行的操作。如需轮询长时间运行的操作,请调用 operations.get
响应中的 SetDefaultProcessorVersionMetadata
表示操作的状态。
{ "name": "projects/PROJECT_ID/locations/LOCATION/operations/OPERATION", "metadata": { "@type": "type.googleapis.com/google.cloud.documentai.v1.SetDefaultProcessorVersionMetadata", "commonMetadata": { "state": "SUCCEEDED", "createTime": "2022-03-02T22:52:49.957096Z", "updateTime": "2022-03-02T22:52:50.175976Z", "resource": "projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION" } }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.documentai.v1.SetDefaultProcessorVersionResponse" } }
C#
如需了解详情,请参阅 Document AI C# API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Go
如需了解详情,请参阅 Document AI Go API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解详情,请参阅 Document AI Java API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解详情,请参阅 Document AI Python API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Ruby
如需了解详情,请参阅 Document AI Ruby API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
部署处理器版本
使用 Document AI 创建新的处理器版本后,您需要先部署该版本,然后才能使用该版本处理文档。
控制台
在 Google Cloud 控制台的 Document AI 部分,前往处理器页面。
在处理器列表中,点击要查看其详细信息的处理器的名称。
在处理器的管理版本(或部署和使用)标签页中,选中要部署的处理器版本旁边的复选框。
点击部署,然后在对话框窗口中再次点击部署。此过程需要几分钟才能完成。
REST
此示例展示了如何使用 processorVersions.deploy
方法为处理器部署处理器版本。
在使用任何请求数据之前,请先进行以下替换:
- LOCATION:处理器的位置,例如:
us
- 美国eu
- 欧盟
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROCESSOR_ID:自定义处理器的 ID。
- PROCESSOR_VERSION:处理器版本标识符。
HTTP 方法和网址:
POST https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:deploy
如需发送请求,请选择以下方式之一:
curl
执行以下命令:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d "" \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:deploy"
PowerShell
执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:deploy" | Select-Object -Expand Content
该响应是一个长时间运行的操作。如需轮询长时间运行的操作,请调用 operations.get
响应中的 DeployProcessorVersionMetadata
表示操作的状态。
{ "name": "projects/PROJECT_ID/locations/LOCATION/operations/OPERATION", "metadata": { "@type": "type.googleapis.com/google.cloud.documentai.v1.DeployProcessorVersionMetadata", "commonMetadata": { "state": "SUCCEEDED", "createTime": "2022-08-29T16:27:00.195539Z", "updateTime": "2022-08-29T16:32:01.963962Z", "resource": "projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION" } }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.documentai.v1.DeployProcessorVersionResponse" } }
C#
如需了解详情,请参阅 Document AI C# API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Go
如需了解详情,请参阅 Document AI Go API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解详情,请参阅 Document AI Java API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解详情,请参阅 Document AI Python API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Ruby
如需了解详情,请参阅 Document AI Ruby API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
取消部署处理器版本
使用 Document AI 创建新的处理器版本并部署后,如果您不希望该处理器版本能够处理请求,可以取消部署该版本。
控制台
在 Google Cloud 控制台的 Document AI 部分,前往处理器页面。
在处理器列表中,点击要查看其详细信息的处理器的名称。
在处理器的管理版本(或部署和使用)标签页中,选中您要取消部署的处理器版本旁边的复选框。
点击取消部署,然后在对话框窗口中再次点击取消部署。 此过程需要几分钟才能完成。
REST
此示例展示了如何使用 processorVersions.undeploy
方法取消部署处理器的某个版本。
在使用任何请求数据之前,请先进行以下替换:
- LOCATION:处理器的位置,例如:
us
- 美国eu
- 欧盟
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROCESSOR_ID:自定义处理器的 ID。
- PROCESSOR_VERSION:处理器版本标识符。
HTTP 方法和网址:
POST https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:undeploy
如需发送请求,请选择以下方式之一:
curl
执行以下命令:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d "" \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:undeploy"
PowerShell
执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:undeploy" | Select-Object -Expand Content
该响应是一个长时间运行的操作。如需轮询长时间运行的操作,请调用 operations.get
响应中的 UndeployProcessorVersionMetadata
表示操作的状态。
{ "name": "projects/PROJECT_ID/locations/LOCATION/operations/OPERATION", "metadata": { "@type": "type.googleapis.com/google.cloud.documentai.v1.UndeployProcessorVersionMetadata", "commonMetadata": { "state": "SUCCEEDED", "createTime": "2022-08-29T16:27:00.195539Z", "updateTime": "2022-08-29T16:32:01.963962Z", "resource": "projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION" } }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.documentai.v1.UndeployProcessorVersionResponse" } }
C#
如需了解详情,请参阅 Document AI C# API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Go
如需了解详情,请参阅 Document AI Go API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解详情,请参阅 Document AI Java API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解详情,请参阅 Document AI Python API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Ruby
如需了解详情,请参阅 Document AI Ruby API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
删除处理器版本
使用 Document AI 创建新的处理器版本后,如果您不再需要该处理器版本,可以将其删除。
控制台
在 Google Cloud 控制台的 Document AI 部分,前往处理器页面。
在处理器列表中,点击要查看其详细信息的处理器的名称。
在处理器的管理版本(或部署和使用)标签页中,点击要删除的处理器版本旁边的操作菜单
。点击删除,然后在对话框窗口中再次点击删除。
REST
此示例展示了如何使用 processorVersions.delete
方法删除处理器的处理器版本。
在使用任何请求数据之前,请先进行以下替换:
- LOCATION:处理器的位置,例如:
us
- 美国eu
- 欧盟
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROCESSOR_ID:自定义处理器的 ID。
- PROCESSOR_VERSION:处理器版本标识符。
HTTP 方法和网址:
DELETE https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION
如需发送请求,请选择以下方式之一:
curl
执行以下命令:
curl -X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION"
PowerShell
执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method DELETE `
-Headers $headers `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION" | Select-Object -Expand Content
该响应是一个长时间运行的操作。如需轮询长时间运行的操作,请调用 operations.get
响应中的 DeleteProcessorVersionMetadata
表示操作的状态。
{ "name": "projects/PROJECT_ID/locations/LOCATION/operations/OPERATION", "metadata": { "@type": "type.googleapis.com/google.cloud.documentai.v1.DeleteProcessorVersionMetadata", "commonMetadata": { "state": "SUCCEEDED", "createTime": "2022-08-29T16:27:00.195539Z", "updateTime": "2022-08-29T16:32:01.963962Z", "resource": "projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION" } }, "done": true, "response": { "@type": "type.googleapis.com/google.protobuf.Empty" } }
C#
如需了解详情,请参阅 Document AI C# API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Go
如需了解详情,请参阅 Document AI Go API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Java
如需了解详情,请参阅 Document AI Java API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Python
如需了解详情,请参阅 Document AI Python API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Ruby
如需了解详情,请参阅 Document AI Ruby API 参考文档。
如需向 Document AI 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
导入处理器版本
使用 Document AI 创建新处理器后,您可以从同一项目或不同项目导入处理器版本。
destination project
是您开始导入的位置,也是处理器版本在导入后可用的位置。
source project
是源处理器的版本所在的位置。
源处理器或目标处理器必须满足以下要求才能导入:
- 处理器类型必须一致。示例:
CUSTOM_EXTRACTION_PROCESSOR
或INVOICE_PROCESSOR
- 处理器架构不得冲突。
- 目标处理器可以有现有的数据集和版本。
- 目标处理器必须处于
ENABLED
状态。 - 源处理器的版本必须处于以下某种状态:
DEPLOYED
DEPLOYING
UNDEPLOYED
UNDEPLOYING
您必须向目标项目的 DocumentAI Core Service Agent 授予源项目的 Document AI 编辑者权限,以免出现权限遭拒错误。
对于基于 Gemini 1.5 及更高版本的处理器版本(例如自定义提取器
pretrained-foundation-model-v1.2-2024-05-10
),您可以导入微调后的处理器版本。
在导入处理器版本之前,请完成以下步骤以设置权限:
控制台
查找 DocumentAI Core Service Agent,然后填写目标项目编号。 DocumentAI Core Service Agent 的格式与电子邮件地址类似。例如
service-123@gcp-sa-prod-dai-core.iam.gserviceaccount.com
在 Google Cloud 控制台中打开 IAM 页面。
选择源项目。
点击“授予访问权限”。
添加目标项目的 DocumentAI Core Service Agent 作为新主账号,并分配 Document AI Editor 角色。
gcloud
使用以下 gcloud
命令授予必要的权限:
gcloud projects add-iam-policy-binding SOURCE_PROJECT \ --member=serviceAccount:service-DESTINATION_PROJECT NUMBER@gcp-sa-prod-dai-core.iam.gserviceaccount.com \ --role=roles/documentai.editor
请提供以下值:
SOURCE_PROJECT
:源项目编号或项目 ID。DESTINATION_PROJECT NUMBER
:目标项目编号。
更新权限后,请按照以下步骤导入处理器版本:
控制台
在 Google Cloud 控制台的 Document AI 部分,前往处理器页面。
在处理器列表中,点击要将处理器版本导入到的目标处理器的名称。
前往管理版本(或部署和使用)标签页,然后点击导入。
在窗口中选择项目、处理器和处理器版本作为源处理器版本。
点击窗口中的导入按钮,系统将开始执行导入操作。
REST
此示例展示了如何使用 processorVersions.importProcessorVersion
方法导入处理器版本。
在使用任何请求数据之前,请先进行以下替换:
- 目标项目
- DESTINATION_PROJECT_ID:您的目标 Google Cloud 项目 ID。
- DESTINATION_LOCATION:目标处理器的位置。
- DESTINATION_PROCESSOR_ID:目标处理器的 ID。
- 源项目
- SOURCE_PROJECT_ID:您的源 Google Cloud 项目 ID。
- SOURCE_LOCATION:源处理器的位置。
- SOURCE_PROCESSOR_ID:源处理器的 ID。
- SOURCE_PROCESSOR_VERSION:要导入的源处理器版本。
HTTP 方法和网址:
POST https://DESTINATION_LOCATION-documentai.googleapis.com/v1beta3/projects/DESTINATION_PROJECT_ID/locations/DESTINATION_LOCATION/processors/DESTINATION_PROCESSOR_ID/processorVersions:importProcessorVersion
请求 JSON 正文:
{ "processorVersionSource": "projects/SOURCE_PROJECT_ID/locations/SOURCE_LOCATION/processors/SOURCE_PROCESSOR_ID/processorVersions/SOURCE_PROCESSOR_VERSION" }
如需发送请求,请选择以下方式之一:
curl
将请求正文保存在名为 request.json
的文件中,然后执行以下命令:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://DESTINATION_LOCATION-documentai.googleapis.com/v1beta3/projects/DESTINATION_PROJECT_ID/locations/DESTINATION_LOCATION/processors/DESTINATION_PROCESSOR_ID/processorVersions:importProcessorVersion"
PowerShell
将请求正文保存在名为 request.json
的文件中,然后执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://DESTINATION_LOCATION-documentai.googleapis.com/v1beta3/projects/DESTINATION_PROJECT_ID/locations/DESTINATION_LOCATION/processors/DESTINATION_PROCESSOR_ID/processorVersions:importProcessorVersion" | Select-Object -Expand Content
您应该收到类似以下内容的 JSON 响应:
{ "name": "projects/DESTINATION_PROJECT_ID/locations/DESTINATION_LOCATION/operations/OPERATION_ID" }
如果您要跨 Virtual Private Cloud Service Controls (VPC-SC) 边界导入,请查看配置入站和出站政策并设置 VPC Service Controls 边界,然后设置以下规则。
为 ingress 提供以下值:
DESTINATION_PROJECT
:目标项目编号。SOURCE_PROJECT
:源项目编号。
- ingressFrom: identities: - ANY_SERVICE_ACCOUNT sources: - resource: DESTINATION_PROJECT ingressTo: operations: - serviceName: aiplatform.googleapis.com methodSelectors: - method: all actions - serviceName: documentai.googleapis.com methodSelectors: - method: all actions resources: - projects/SOURCE_PROJECT
为 egress 提供以下值:
- egressTo: operations: - serviceName: storage.googleapis.com methodSelectors: - method: google.storage.objects.create - method: google.storage.buckets.testIamPermissions resources: - projects/DESTINATION_PROJECT egressFrom: identities: - ANY_SERVICE_ACCOUNT
使用以下值设置 VPC 目标边界。
- egressTo: operations: - serviceName: aiplatform.googleapis.com methodSelectors: - method: all actions - serviceName: documentai.googleapis.com methodSelectors: - method: all actions - serviceName: storage.googleapis.com methodSelectors: - method: google.storage.buckets.testIamPermissions - method: google.storage.objects.get - method: google.storage.objects.create resources: - projects/SOURCE_PROJECT egressFrom: identities: - ANY_SERVICE_ACCOUNT sourceRestriction: DISABLED