Cloud TPU 错误术语表

本文档提供了常见错误术语表,以及 Cloud TPU 服务提供的解决方案。


加速器类型无效

错误消息

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

解决方案

向 create 命令提供了无效的参数。可用性 取决于以下参数:类型、 preemptible 标志、spot 标志和 reserved 标志。您可以通过在创建命令中添加或排除 preemptiblespotreserved 标志来更改这些标志。

使用 reserved 标志创建的 TPU 将使用预留的 TPU 容量。添加 spotpreemptible 标志后,更高优先级的 TPU 将能够抢占此 TPU。如果上述标志均未提供,则 TPU 将按需使用。时间是 不是有效的配置,因此无法启用多个标志。请参阅 如需了解详情,请参阅 create 命令文档

如需了解每个可用区中可用的加速器类型,请参阅 TPU 区域和可用区文档,也可以 使用 accelerator-types list 命令查询的数据。将 create 命令更改为使用 这些加速器类型,然后重试。如果问题仍然存在,请与支持团队联系。

找不到网络

错误消息

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

解决方案

找不到影音平台 xxxx。确保已创建网络 并进行正确设置如需了解详情,请参阅创建和管理 VPC 网络

服务账号权限遭拒

错误消息

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

解决方案

如果用户尝试在没有 IAM 授权的情况下在项目中创建或列出节点,就会发生此错误。导致此问题的一个可能原因是 Cloud TPU API 服务账号没有项目所需的角色。“管理访问权限账号”文档简要介绍了如何管理访问权限。按照授予或撤消单个角色中的步骤操作 并将账号命名为“service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com”。“Cloud TPU API Service Agent”角色(请务必将 PROJECT_NUMBER 项目编号,您可以在 Google Cloud 控制台的项目设置中找到)。如需详细了解服务代理,请参阅服务代理文档

已超出配额

错误消息

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

解决方案

您的项目已达到配额上限。如需详细了解如何使用配额,请参阅 Cloud 配额文档。这不应与用于管理 TPU Pod 用量的 TPU 配额混淆。

您可以按照申请更高配额中列出的步骤申请提高相应的上限。在“配额”页面上,您可以搜索此邮件中“YYYY”部分指定的配额。一些配额会拆分到不同的区域或服务之间。错误消息会指明需要增加哪个级别的值。

消息中的“XXXX”和“YYYY”部分可以是以下各项之一:

  • HEALTH_CHECKS -“健康检查”配额
  • 防火墙 -“防火墙规则”配额
  • NETWORK_ENDPOINT_GROUPS - 此区域的“网络端点组”配额
  • READ_REQUESTS - Compute Engine API 服务的“每分钟读取请求数”配额
  • OPERATION_READ_REQUESTS -“每分钟的操作读取请求数”配额

我们通常会在 2-3 个工作日内处理此请求。如果请求紧急,请与客户工程师或技术支持客户经理联系。