このページは Cloud Translation API によって翻訳されました。

エラーコード 429

リクエスト数がリクエストの処理に割り当てられた容量を超えると、エラーコード 429 が返されます。次の表に、各タイプの割り当てフレームワークによって生成されるエラーメッセージを示します。

割り当てフレームワーク	メッセージ
従量課金制	`Resource exhausted, please try again later.`
プロビジョンドスループット	`Too many requests. Exceeded the Provisioned Throughput.`

プロビジョンドスループットのサブスクリプションを使用すると、特定の生成 AI モデルのために一定量のスループットを予約できます。プロビジョンドスループットのサブスクリプションがなく、アプリケーションでリソースを使用できない場合、エラーコード 429 が返されます。予約済みの容量がない状況でも、再度リクエストを試すことはできます。ただし、この場合のリクエストは、サービスレベル契約（SLA）に記載されているエラー率にカウントされません。

プロビジョンドスループットを購入したプロジェクトの場合、Vertex AI はプロジェクトのスループットを測定し、購入したスループット量をプロジェクトの実際の使用量に対して予約します。

標準のプロビジョニングされたスループットの場合、購入した量よりも少ない量を使用すると、通常なら 429 になるエラーが 5XX として返され、SLA のエラー率にカウントされます。シングルゾーンプロビジョニングスループットの場合、購入した量よりも少ない量を使用すると、容量関連の 429 エラーは 5XX として扱われますが、SLA エラー率にはカウントされません。購入した量を超えると、追加のリクエストはオンデマンドで従量課金制として処理されます。

従量課金制

従量課金制の割り当てフレームワークでは、429 エラーを解決するために次のオプションがあります。

可能な限り、リージョンエンドポイントではなくグローバルエンドポイントを使用します。
切り捨て型指数バックオフを使用して再試行方法を実装する。
モデルで割り当てを使用している場合は、割り当て増加リクエスト（QIR）を送信できます。モデルで動的共有割り当てを使用している場合は、トラフィックを平滑化して大きなスパイクを減らすと効果的です。詳細については、動的共有割り当て（DSQ）をご覧ください。
より一貫したサービスレベルを実現するために、プロビジョンドスループットに登録する。詳細については、プロビジョンドスループットをご覧ください。

プロビジョンドスループット

プロビジョンドスループットによって生成された 429 エラーを修正するには、次の操作を行います。

予測リクエストでヘッダーを設定しないデフォルトの動作の例を使用します。超過分はオンデマンドで処理され、従量課金制で請求されます。
プロビジョンドスループットのサブスクリプションの GSU 数を増やします。

次のステップ

動的共有割り当ての詳細を確認する。動的共有割り当てをご覧ください。
プロビジョンドスループットの詳細については、プロビジョンドスループットをご覧ください。
Vertex AI の割り当てと上限の詳細について、Vertex AI の割り当てと上限を確認する。
Google Cloud の割り当てとシステムの上限の詳細については、Cloud Quotas のドキュメントをご覧ください。
API エラーの詳細については、API エラーをご覧ください。

エラーコード 429 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

従量課金制

プロビジョンド スループット

次のステップ

エラーコード 429

プロビジョンドスループット