Cloud TPU エラーの用語集
このドキュメントでは、Cloud TPU サービスの一般的なエラーの用語集およびその解決方法を紹介します。
無効なアクセラレータ タイプ
エラー メッセージ
generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and reserved (false) is not available in zone us-central1-a, please contact support.
解決策
create コマンドに無効なパラメータが指定されています。ゾーン内のアクセラレータを使用できるかどうかは、タイプ、preemptible
フラグ、spot
フラグ、reserved
フラグの 4 つのパラメータによって決まります。preemptible
フラグ、spot
フラグ、reserved
フラグを変更するには、create コマンドでフラグを指定または除外します。
reserved
フラグを指定して作成された TPU は、予約済みの容量を使用します。spot
フラグまたは preemptible
フラグを指定すると、TPU は優先度の高い TPU によってプリエンプトできます。どのフラグも指定されない場合、TPU はオンデマンドになります。これらのフラグを複数有効にする構成は有効ではありません。詳細については、create コマンドのドキュメントをご覧ください。
各ゾーンで使用できるアクセラレータのタイプは、TPU のリージョンとゾーンのドキュメントで確認できます。また、アクセラレータ タイプ リスト コマンドでクエリすることもできます。これらのアクセラレータ タイプのいずれかを使用するように create コマンドを変更し、もう一度お試しください。問題が解決しない場合は、サポートにお問い合わせください。
ネットワークが見つかりません
エラー メッセージ
Cloud TPU received a bad request. The field "Network" cannot be "xxxx": requested resource not found
解決策
ネットワーク「xxxx」が見つかりませんでした。ネットワークが作成され、適切に設定されていることを確認します。詳細については、VPC ネットワークを作成して管理するをご覧ください。
サービス アカウントの権限が拒否された
エラー メッセージ
generic::permission_denied: Cloud TPU got permissions denied when trying to access the customer project. Make sure that the IAM account 'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts
解決策
このエラーは、ユーザーが IAM 認証なしでプロジェクトのノードを作成または一覧表示しようとした場合に発生します。この問題の考えられる原因は、Cloud TPU API サービス アカウントにプロジェクトに必要なロールが付与されていないことです。アクセス アカウントの管理ドキュメントで、アクセスの管理方法の概要を説明します。単一のロールの付与または取り消しの手順に従って、アカウントに「service-PROJECT_NUMBER
@cloud-tpu.iam.gserviceaccount.com」のロールを「Cloud TPU API Service Agent」に付与します。(PROJECT_NUMBER
はプロジェクト番号に置き換えます。プロジェクト番号は Google Cloud コンソールのプロジェクト設定で確認できます)。サービス エージェントの詳細については、サービス エージェントのドキュメントをご覧ください。
上限を超えています
エラー メッセージ
You have reached XXXX limit. Please request an increase for the 'YYYY' quota for Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.
解決策
プロジェクトが割り当て上限に達しました。割り当て操作の詳細については、Cloud Quota のドキュメントをご覧ください。TPU Pod の使用を制御する TPU 割り当てと混同しないでください。
割り当ての増加をリクエストするに記載されている手順に沿って、適切な上限まで引き上げるようリクエストできます。割り当てページで、このメッセージの「YYYY」部分で指定されている割り当てを検索できます。一部の割り当ては、異なるリージョンやサービスに分割されています。どちらを増やす必要があるかは、エラー メッセージで示されます。
メッセージの「XXXX」と「YYYY」の部分は、次のいずれかになります。
- HEALTH_CHECKS - 「ヘルスチェック」の割り当て
- ファイアウォール - 「ファイアウォール ルール」の割り当て
- NETWORK_ENDPOINT_GROUPS - このリージョンの「ネットワーク エンドポイント グループ」の割り当て
- READ_REQUESTS - Compute Engine API サービスの「1 分あたりの読み取りリクエスト数」の割り当て
- OPERATION_READ_REQUESTS - 「1 分あたりのオペレーション読み取りリクエスト数」の割り当て
通常、このリクエストは 2 ~ 3 営業日以内に処理されます。リクエストが緊急を要する場合は、カスタマー エンジニアまたはテクニカル アカウント マネージャーにお問い合わせください。