エラーコード 429

リクエスト数がリクエストの処理に割り当てられた容量を超えると、エラーコード 429 が返されます。次の表に、各タイプの割り当てフレームワークによって生成されるエラー メッセージを示します。

割り当てフレームワーク メッセージ
従量課金制 Resource exhausted, please try again later.
プロビジョンド スループット Too many requests. Exceeded the Provisioned Throughput.

プロビジョンド スループットのサブスクリプションを使用すると、特定の生成 AI モデルのために一定量のスループットを予約できます。プロビジョンド スループットのサブスクリプションがなく、アプリケーションでリソースを使用できない場合、エラーコード 429 が返されます。予約済みの容量がない状況でも、再度リクエストを試すことはできます。ただし、この場合のリクエストは、サービスレベル契約(SLA)に記載されているエラー率にカウントされません。

プロビジョンド スループットを購入したプロジェクトの場合、Vertex AI はプロジェクトのスループットを測定し、購入したスループット量をプロジェクトの実際の使用量に対して予約します。

標準のプロビジョニングされたスループットの場合、購入した量よりも少ない量を使用すると、通常なら 429 になるエラーが 5XX として返され、SLA のエラー率にカウントされます。シングル ゾーン プロビジョニング スループットの場合、購入した量よりも少ない量を使用すると、容量関連の 429 エラーは 5XX として扱われますが、SLA エラー率にはカウントされません。購入した量を超えると、追加のリクエストはオンデマンドで従量課金制として処理されます。

従量課金制

従量課金制の割り当てフレームワークでは、429 エラーを解決するために次のオプションがあります。

プロビジョンド スループット

プロビジョンド スループットによって生成された 429 エラーを修正するには、次の操作を行います。

  • 予測リクエストでヘッダーを設定しないデフォルトの動作の例を使用します。超過分はオンデマンドで処理され、従量課金制で請求されます。
  • プロビジョンド スループットのサブスクリプションの GSU 数を増やします。

次のステップ