Cloud TPU エラーの用語集

このドキュメントでは、Cloud TPU サービスの一般的なエラーの用語集およびその解決方法を紹介します。


無効なアクセラレータ タイプ

エラー メッセージ

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

解決策

create コマンドに無効なパラメータが指定されています。ゾーン内のアクセラレータを使用できるかどうかは、タイプ、preemptible フラグ、spot フラグ、reserved フラグの 4 つのパラメータによって決まります。preemptible フラグ、spot フラグ、reserved フラグを変更するには、create コマンドでフラグを指定または除外します。

reserved フラグを指定して作成された TPU は、予約済みの容量を使用します。spot フラグまたは preemptible フラグを指定すると、TPU は優先度の高い TPU によってプリエンプトできます。どのフラグも指定されない場合、TPU はオンデマンドになります。これらのフラグを複数有効にする構成は有効ではありません。詳細については、create コマンドのドキュメントをご覧ください。

各ゾーンで使用できるアクセラレータのタイプは、TPU のリージョンとゾーンのドキュメントで確認できます。また、アクセラレータ タイプ リスト コマンドでクエリすることもできます。これらのアクセラレータ タイプのいずれかを使用するように create コマンドを変更し、もう一度お試しください。問題が解決しない場合は、サポートにお問い合わせください。

ネットワークが見つかりません

エラー メッセージ

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

解決策

ネットワーク「xxxx」が見つかりませんでした。ネットワークが作成され、適切に設定されていることを確認します。詳細については、VPC ネットワークを作成して管理するをご覧ください。

サービス アカウントの権限が拒否された

エラー メッセージ

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

解決策

このエラーは、ユーザーが IAM 認証なしでプロジェクトのノードを作成または一覧表示しようとした場合に発生します。この問題の考えられる原因は、Cloud TPU API サービス アカウントにプロジェクトに必要なロールが付与されていないことです。アクセス アカウントの管理ドキュメントで、アクセスの管理方法の概要を説明します。単一のロールの付与または取り消しの手順に従って、アカウントに「service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com」のロールを「Cloud TPU API Service Agent」に付与します。(PROJECT_NUMBER はプロジェクト番号に置き換えます。プロジェクト番号は Google Cloud コンソールのプロジェクト設定で確認できます)。サービス エージェントの詳細については、サービス エージェントのドキュメントをご覧ください。

上限を超えています

エラー メッセージ

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

解決策

プロジェクトが割り当て上限に達しました。割り当て操作の詳細については、Cloud Quota のドキュメントをご覧ください。TPU Pod の使用を制御する TPU 割り当てと混同しないでください。

割り当ての増加をリクエストするに記載されている手順に沿って、適切な上限まで引き上げるようリクエストできます。割り当てページで、このメッセージの「YYYY」部分で指定されている割り当てを検索できます。一部の割り当ては、異なるリージョンやサービスに分割されています。どちらを増やす必要があるかは、エラー メッセージで示されます。

メッセージの「XXXX」と「YYYY」の部分は、次のいずれかになります。

  • HEALTH_CHECKS - 「ヘルスチェック」の割り当て
  • ファイアウォール - 「ファイアウォール ルール」の割り当て
  • NETWORK_ENDPOINT_GROUPS - このリージョンの「ネットワーク エンドポイント グループ」の割り当て
  • READ_REQUESTS - Compute Engine API サービスの「1 分あたりの読み取りリクエスト数」の割り当て
  • OPERATION_READ_REQUESTS - 「1 分あたりのオペレーション読み取りリクエスト数」の割り当て

通常、このリクエストは 2 ~ 3 営業日以内に処理されます。リクエストが緊急を要する場合は、カスタマー エンジニアまたはテクニカル アカウント マネージャーにお問い合わせください。