エラーコード 429

リクエスト数がリクエストの処理に割り当てられた容量を超えると、エラーコード 429 が返されます。次の表に、各タイプの割り当てフレームワークによって生成されるエラーメッセージを示します。

割り当てフレームワーク	メッセージ
従量課金制	`Resource exhausted, please try again later.`
プロビジョンドスループット	`Too many requests. Exceeded the Provisioned Throughput.`

プロビジョンドスループットのサブスクリプションがある場合、特定の生成 AI モデルのために一定量のスループットを予約できます。プロビジョンドスループットのサブスクリプションがなく、アプリケーションでリソースを使用できない場合、エラーコード 429 が返されます。予約済みの容量がない状況でも、再度リクエストを試すことはできます。ただし、この場合のリクエストは、サービスレベル契約（SLA）に記載されているエラー率にカウントされません。

プロビジョンドスループットを購入したプロジェクトの場合、Vertex AI はプロジェクトのスループットを測定し、購入したスループット量をプロジェクトの実際の使用量に対して予約します。

標準プロビジョンドスループットの場合、購入した量よりも少ない量を使用すると、通常なら 429 になるエラーが 5XX として返され、SLA のエラー率にカウントされます。シングルゾーンプロビジョンドスループットの場合、購入した量よりも少ない量を使用すると、容量関連の 429 エラーは 5XX として扱われますが、SLA エラー率にはカウントされません。購入した量を超えると、追加のリクエストはオンデマンドで従量課金制として処理されます。

従量課金制

従量課金制の割り当てフレームワークでは、429 エラーを解決するために次のオプションがあります。

可能な限り、リージョンエンドポイントではなくグローバルエンドポイントを使用する。
切り捨て型指数バックオフを使用して再試行方法を実装する。
モデルで割り当てを使用している場合は、割り当て増加リクエスト（QIR）を送信する。モデルで動的共有割り当てを使用している場合は、トラフィックを平滑化して大きなスパイクを減らすと効果的です。詳細については、動的共有割り当て（DSQ）をご覧ください。
より一貫したサービスレベルを実現するために、プロビジョンドスループットに登録する。詳細については、プロビジョンドスループットをご覧ください。

プロビジョンドスループット

プロビジョンドスループットによって生成された 429 エラーを修正するには、次の操作を行います。

予測リクエストでヘッダーを設定しないデフォルトの動作の例を使用します。超過分はオンデマンドで処理され、従量課金制で請求されます。
プロビジョンドスループットのサブスクリプションの GSU 数を増やします。

次のステップ

動的共有割り当てで動的共有割り当ての詳細を確認する。
プロビジョンドスループットでプロビジョンドスループットの詳細を確認する。
Vertex AI の割り当てと上限で Vertex AI の割り当てと上限の詳細を確認する。
Cloud Quotas のドキュメントで Google Cloud の割り当てとシステムの上限の詳細を確認する。
API エラーで API エラーの詳細を確認する。

エラーコード 429

従量課金制

プロビジョンド スループット

次のステップ

プロビジョンドスループット