Cloud TPU 錯誤詞彙表

本文件提供 Cloud TPU 服務的常見錯誤與解決方案。


加速器類型無效

錯誤訊息

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

解決方案

您提供給 create 指令的參數無效。加速器在某個區域的可用性取決於下列參數:類型、preemptible 標記、spot 標記和 reserved 標記。您可以在建立指令中加入或排除 preemptiblespotreserved 標記,藉此變更這些標記。

使用 reserved 標記建立的 TPU 會使用保留容量。加入 spotpreemptible 旗標,可讓 TPU 遭到優先順序較高的 TPU 先占。如果未提供這些標記,系統會使用隨選 TPU。啟用多個標記並非有效的設定。詳情請參閱建立指令說明文件

您可以在 TPU 地區和區域說明文件中查看各區域適用的加速器類型,也可以使用 accelerator-types list 指令查詢。請變更建立指令,使用其中一種加速器類型,然後再試一次。如果問題仍未解決,請與支援團隊聯絡。

找不到網路

錯誤訊息

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

解決方案

找不到網路 xxxx。請確認已正確建立及設定網路。詳情請參閱「建立及管理虛擬私有雲網路」。

服務帳戶權限遭拒

錯誤訊息

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

解決方案

當使用者嘗試在未經 IAM 授權的專案中建立或列出節點時,就會發生這個錯誤。這個問題可能的原因是 Cloud TPU API 服務帳戶沒有專案所需的角色。管理存取帳戶說明文件提供存取權管理方式的總覽。請按照授予或撤銷單一角色的步驟操作,並將「Cloud TPU API Service Agent」角色授予帳戶「service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com」(請務必將 PROJECT_NUMBER 替換為您的專案編號,您可以在 Google Cloud 控制台的專案設定中找到這項資訊)。如要進一步瞭解服務代理,請參閱服務代理說明文件

超過配額

錯誤訊息

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

解決方案

您的專案已達配額上限。如要進一步瞭解如何使用配額,請參閱 Cloud 配額說明文件。請勿將這項配額與 TPU 配額混淆,後者是用於管理 TPU Pod 的用量。

如要申請提高相應限制,請按照「申請更多配額」一節的步驟操作。您可以在配額頁面中搜尋這則訊息中「YYYY」部分指定的配額。部分配額會分散在不同區域或服務中。錯誤訊息會指出需要增加哪一個。

訊息中的「XXXX」和「YYYY」部分可以是下列任一值:

  • HEALTH_CHECKS - 健康狀態檢查配額
  • 防火牆 -「防火牆規則」配額
  • NETWORK_ENDPOINT_GROUPS - 這個地區的「網路端點群組」配額
  • READ_REQUESTS - Compute Engine API 服務的「每分鐘讀取要求數」配額
  • OPERATION_READ_REQUESTS - 每分鐘的「作業讀取要求」配額

這項要求通常會在 2 到 3 個工作天內處理完畢。如果要求屬於緊急案件,請與客戶工程師或客戶技術顧問聯絡。