リソース可用性エラーのトラブルシューティング


このドキュメントでは、新しい Compute Engine リソースのリクエストや、Compute Engine リソースの予約の作成時に発生する可能性のある、リソースの可用性に関するエラーの解決方法について説明します。リソースエラーは、GPU や CPU などの Compute Engine リソースが現在利用できないことが原因でリクエストに対応できないゾーンで、新しいリソースをリクエストしようとした場合に発生します。

リソースエラーは、ゾーン内の新しいリソース リクエストにのみ適用され、既存のリソースには影響しません。リソースエラーは、Compute Engine の割り当てとは関係なく、ゾーン内のすべてのリソースではなく、リクエストの送信時に指定したリソースにのみ適用されます。

一般的なエラー メッセージ

以下に、新しい Compute Engine リソースをリクエストするとき、または新しい予約を作成するときに発生する可能性のある一般的なリソースエラーの例を示します。

ZONE_RESOURCE_POOL_EXHAUSTED
ZONE_RESOURCE_POOL_EXHAUSTED_WITH_DETAILS
The zone 'projects/PROJECT_ID/zones/ZONE' does not have enough resources available to fulfill the request.
Try a different zone, or try again later.
A VM_TYPE_AND_SIZE VM instance with RESOURCE_ATTACHMENT is currently unavailable in the ZONE zone.

Capacity changes frequently, so try your request in a different zone, with a different VM hardware
configuration, or at a later time. For more options, see troubleshooting documentation.
A VM_TYPE_AND_SIZE VM instance with RESOURCE_ATTACHMENT is currently unavailable in the ZONE zone, because of  REASON.

Consider trying your request in the ZONE zone(s), which currently has capacity to accommodate your request.

If you cannot move your VM to ZONE, review the REASON failure resolution instructions available in troubleshooting documentation, then try your request again.
If your workload can't accommodate the suggested resolution, try your request with a different VM hardware configuration or at a later time.

一部のエラー メッセージには、Compute Engine がリクエストから処理できなかった特定のリソースに関する情報を示す reason フィールドが含まれます。リソースエラーが発生する理由と、各エラー reason の解決方針については、このドキュメントのリソースのエラーの理由と推奨事項のセクションをご覧ください。

リソースエラーを解決する

一般に、リソースエラーを解決する最良の方法は、別のゾーン、別の時間に、または別の VM 構成でリクエストを再試行することです。表示されたエラー メッセージに reason フィールドが含まれている場合は、このドキュメントのリソースエラーの理由と推奨事項のセクションで、エラーの解決に役立つ具体的な修復の推奨事項を確認できます。

GPU VM を含むゾーン マネージド インスタンス グループ(MIG)を作成する場合は、MIG でサイズ変更リクエストを作成します。サイズ変更リクエストは、需要の高いリソースを MIG で一度に取得し、特定の時間 VM を実行する場合に役立ちます。実行期間を指定すると、需要の高いリソースの取得可能性が向上し、不要な料金が発生しません。

リージョン MIG を作成する場合は、MIG の分配形態を BALANCEDANY、または ANY_SINGLE_ZONE に変更してみてください。分配形態の詳細については、リージョン MIG のターゲット分配形態をご覧ください。

Spot VM(またはレガシー プリエンプティブル VM)を作成する場合、これらは計画されていない不安定な予備容量であるため、ピーク需要時に取得できない可能性があります。したがって、Spot VM は、時間、ロケーション、VM の構成要件が柔軟なワークロードにのみおすすめします。ベスト プラクティスに沿ってワークロードの柔軟性を高め、Spot VM のこのエラーを防ぐことができます。このエラーが解消されない場合は、代わりに標準 VM を使用してください。

リソースエラーを防ぐ最善の方法は、リソースが必要になる前に Compute Engine の予約を作成することです。予約を使用すると、必要なときにリソースを確実に利用できます。

リソースのエラーの理由と推奨事項

次の表に、リソースのエラー メッセージに表示される reason フィールドの情報と、各 reason の解決方針に関する推奨事項を示します。

エラー reason 説明 推奨事項
resource_availability リクエストした VM のタイプとサイズは、リクエストされたゾーンで現在使用できません。

次のいずれかの方法をお試しください。

  • 別のゾーンで VM をリクエストします。
  • a3-highgpu-1ga3-highgpu-2ga3-highgpu-4g マシンタイプをリクエストするときにリソース可用性エラーが発生した場合は、サポートされているこれらの方法のいずれかで VM をプロビジョニングしていることを確認してください。
cpu_availability リクエストした CPU 量を持つ VM は、リクエストされたゾーンで現在使用できません。

次のいずれかの方法をお試しください。

  • 単一の VM をリクエストする場合は、別のゾーンで VM をリクエストします。
  • 複数の VM をリクエストする場合は、次のうち 1 つ以上を試してください。

    • 別のゾーンで VM をリクエストします。
    • vCPU の合計量を複数の小規模な VM に分割します。たとえば、224 個の vCPU を搭載した 80 個の VM をリクエストした場合は、それぞれ 128 個の vCPU を搭載した 160 個の VM をリクエストしてみてください。
memory_availability リクエストしたメモリ量を持つ VM は、リクエストされたゾーンで現在使用できません。

次のいずれかの方法をお試しください。

  • 単一の VM をリクエストする場合は、別のゾーンで VM をリクエストします。
  • 複数の VM をリクエストする場合は、次のうち 1 つ以上を試してください。

    • 別のゾーンで VM をリクエストします。
    • メモリ リクエストを複数の VM に分割します。たとえば、1.88 TB のメモリを持つ 3 個の VM をリクエストした場合は、合計メモリが 1.88 TB の複数の VM にリクエストを分割します。
local_ssd_availability リクエストしたローカル SSD の量を持つ VM は、リクエストされたゾーンで現在使用できません。

次のいずれかの方法をお試しください。

  • 単一の VM をリクエストする場合は、別のゾーンで VM をリクエストします。
  • 複数の VM をリクエストする場合は、次のうち 1 つ以上を試してください。

    • 別のゾーンで VM をリクエストします。
    • ワークロードが許す場合は、ローカル SSD ではなく、ゾーンまたはリージョン SSD 永続ディスクをリクエストします。
    • ローカル SSD リクエストを複数の VM に分割します。たとえば、600 GB のローカル SSD を持つ 1 個の VM をリクエストした場合は、600 GB の合計ローカル SSD を持つ複数の VM にリクエストを分割します。
gpu_availability リクエストした GPU を持つ VM は、リクエストしたゾーンでは利用できません。 別のゾーンで VM のリクエストを試してください。

上記の解決策でエラーを解決できなかった場合は、サポートのご利用をお試しください。