Cloud TPU 错误术语表
本文档提供了有关 Cloud TPU 服务解决方案的常见错误术语表。
加速器类型无效
错误消息
generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and reserved (false) is not available in zone us-central1-a, please contact support.
解决方案
向创建命令提供的参数无效。可用区中加速器的可用性取决于 3 个参数:类型、抢占式标志和预留标志。如需更改抢占式和预留的标志,您可以在 create 命令中包含/排除这些标志。
使用预留标志创建的 TPU 将使用预留的容量。添加抢占式标志将允许优先级较高的 TPU 抢占 TPU。如果二者均未提供,则 TPU 将按需使用。启用这两个标志并非有效配置。如需了解详情,请参阅创建命令文档。
您可以在 TPU 区域和可用区文档中找到每个可用区中可用的加速器类型,也可以使用加速器类型列表命令查询它们。请将 create 命令更改为使用其中一种加速器类型,然后重试。如果该问题仍然存在,请与支持团队联系。
未找到网络
错误消息
Cloud TPU received a bad request. The field "Network" cannot be "xxxx": requested resource not found
解决方案
找不到网络 xxxx。请确保已正确创建和设置网络。如需了解详情,请参阅 https://cloud.google.com/vpc/docs/create-modify-vpc-networks。
服务帐号权限遭拒
错误消息
generic::permission_denied: Cloud TPU got permissions denied when trying to access the customer project. Make sure that the IAM account 'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts
解决方案
当用户尝试在没有 IAM 授权的项目中创建或列出节点时,会发生此错误。此问题的可能原因是 Cloud TPU API 服务帐号没有项目所需的角色。管理访问权限帐号文档简要介绍了管理访问权限。按照授予或撤消单个角色步骤操作,并为帐号“service-PROJECT_NUMBER
@cloud-tpu.iam.gserviceaccount.com”授予“Cloud TPU API Service Agent”角色(请务必将 PROJECT_NUMBER
替换为您的项目编号,该编号可在 Google Cloud 控制台的项目设置中找到)。如需详细了解服务代理,请参阅服务代理文档。
已超出配额
错误消息
You have reached XXXX limit. Please request an increase for the 'YYYY' quota for Compute Engine API by following https://cloud.google.com/docs/quota#requesting_higher_quota.
解决方案
您的项目已达到配额限制。如需详细了解如何使用配额,请参阅 https://cloud.google.com/docs/quota。请勿与 TPU 配额(控制 TPU Pod 的使用)混淆。
您可以按照 https://cloud.google.com/docs/quota_detail/view_manage#requesting_higher_quota 中列出的步骤申请提高相应的限额。在配额页面上,您可以搜索此消息的“YYYY”部分指定的配额。一些配额会划分到不同的区域或服务。错误消息中会指明需要增加哪一项。
消息的“XXXX”和“YYYY”部分可能是以下之一: * HEALTH_CHECKS -“健康检查”配额 * FIREWALLS -“防火墙规则”配额 * NETWORK_ENDPOINT_GROUPS - 该区域的“网络端点组”配额 * READ_REQUESTS -“每分钟读取请求的次数”配额
此请求通常会在 2-3 个工作日内得到处理。如果请求紧急,请与客户工程师或技术支持客户经理联系。