生成式 AI 和数据治理

Google 是业界首家发布 AI/机器学习隐私权承诺的公司,该承诺概述了客户应拥有最高级别安全性并能够控制其在云中存储的数据的这一信念。该承诺会延伸到 Google Cloud的生成式 AI 产品。Google 通过健全的数据治理实践(包括审核 Google Cloud 在其产品开发中使用的数据),确保 Google 团队遵循这些承诺。如需详细了解 Google 如何处理数据,另请参阅 Google 的云端数据处理附录 (CDPA)

训练限制

服务专用条款的“服务条款”部分第 17 条“训练限制”中所述,未经您事先许可或指示,Google 不会使用您的数据来训练或微调任何 AI/机器学习模型。

客户数据保留和实现零数据保留

在以下情形和条件下,客户数据会在 Vertex AI 中保留一段时间,以供 Google 模型使用。若要实现零数据保留,客户必须在以下各个方面采取特定措施:

  • Google 模型的数据缓存:默认情况下,Google 基础模型会缓存 Gemini 模型的输入和输出。这样做是为了减少延迟时间,并加快对客户后续提示的回答速度。缓存的内容最多可在处理请求的数据中心存储 24 小时。数据缓存功能在 Google Cloud 项目级启用或停用,系统会对缓存的数据强制提供项目级隐私保护。 Google Cloud 项目的相同缓存设置适用于所有区域。如要实现零数据保留,您必须停用数据缓存。请参阅启用和停用数据缓存
  • 通过提示日志记录监控 Google 模型的滥用行为:如 Google Cloud Platform 服务条款第 4.3 条“生成式 AI 安全和滥用”中所述,Google 可能会在向客户提供生成式 AI 服务的过程中记录提示,以检测潜在的滥用行为和违反其使用限制政策限制使用政策的行为。只有使用 Google Cloud 受 Google Cloud Platform 服务条款约束且没有账单结算的 Cloud Billing 账号的客户才需要记录提示以监控滥用行为。如果您需要记录提示以监控滥用行为,但想要零数据保留,则可以针对滥用行为监控请求例外。请参阅监控滥用行为
  • 使用 Google 搜索建立依据:如服务专用条款第 19 条“生成式 AI 服务:使用 Google 搜索建立依据”中所述,Google 会存储客户可能提供的提示和上下文信息,并将生成的输出内容保存三十 (30) 天,以用于创建有依据的结果和搜索建议。这些存储的信息还可用于调试和测试支持使用 Google 搜索建立依据的系统。如果您使用“使用 Google 搜索建立依据”功能,则无法禁止存储此类信息。
  • 可信测试员计划:如果您之前选择加入该计划,按可信测试员计划条款允许 Google 使用您的数据来改进非正式 AI/机器学习服务,Google 可能会保留您的数据。如需退出此计划,请参阅选择退出可信测试人员计划

启用和停用数据缓存

您可以使用以下 curl 命令来获取缓存状态、停用缓存或重新启用缓存。 停用或重新启用缓存时,更改将应用于所有 Google Cloud 区域。如需详细了解如何使用 Identity and Access Management 授予启用或停用缓存所需的权限,请参阅使用 IAM 进行 Vertex AI 访问权限控制。展开以下部分,了解如何获取当前缓存设置、停用缓存以及启用缓存。

获取当前缓存设置

运行以下命令以确定是否为项目启用或停用了缓存。如需运行此命令,用户必须获得以下角色之一:roles/aiplatform.viewerroles/aiplatform.userroles/aiplatform.admin

PROJECT_ID=PROJECT_ID
# Setup project_id
$ gcloud config set project PROJECT_ID

# GetCacheConfig
$ curl -X GET -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig

# Response if caching is enabled (caching is enabled by default).
{
  "name": "projects/PROJECT_ID/cacheConfig"
}

# Response if caching is disabled.
{
  "name": "projects/PROJECT_ID/cacheConfig"
  "disableCache": true
}
    

停用缓存

运行以下 curl 命令为 Google Cloud 项目停用缓存。如需运行此命令,用户必须获得 Vertex AI 管理员角色 roles/aiplatform.admin

PROJECT_ID=PROJECT_ID
# Setup project_id
$ gcloud config set project PROJECT_ID

# Setup project_id.
$ gcloud config set project ${PROJECT_ID}

# Opt-out of caching.
$ curl -X PATCH -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig -d '{
  "name": "projects/PROJECT_ID/cacheConfig",
  "disableCache": true
}'

# Response.
{
  "name": "projects/PROJECT_ID/locations/us-central1/projects/PROJECT_ID/cacheConfig/operations/${OPERATION_ID}",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.protobuf.Empty"
  }
}
    

启用缓存

如果您为 Google Cloud 项目停用了缓存,并希望重新启用,请运行以下 curl 命令。如需运行此命令,用户必须获得 Vertex AI 管理员角色 roles/aiplatform.admin

PROJECT_ID=PROJECT_ID
LOCATION_ID="us-central1"
# Setup project_id
$ gcloud config set project PROJECT_ID

# Setup project_id.
$ gcloud config set project ${PROJECT_ID}

# Opt in to caching.
$ curl -X PATCH     -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig -d '{
  "name": "projects/PROJECT_ID/cacheConfig",
  "disableCache": false
}'

# Response.
{
  "name": "projects/PROJECT_ID/locations/us-central1/projects/PROJECT_ID/cacheConfig/operations/${OPERATION_NUMBER}",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.protobuf.Empty"
  }
}
    

选择退出可信测试人员计划

如果您之前选择允许 Google 使用您的数据来改进正式发布前的 AI/机器学习服务作为“可信测试员计划”条款的一部分,您可以使用可信测试员计划 - 选择退出请求表单选择退出。

后续步骤