割り当てと上限

このドキュメントでは、Vertex AI エージェント ビルダーに適用される割り当てとシステムの上限について説明します。

  • 割り当ては、使用できるカウント可能な共有リソースの量を指定します。割り当ては、Vertex AI エージェント ビルダーなどの Google Cloud サービスによって定義されます。
  • システムの上限は固定値で、変更できません。

Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

Vertex AI Agent Builder リソースにはシステムの上限もあります。システムの上限は変更できません。

数量に基づく割り当て

次の割り当ては、時間が経過してもリセットされず、代わりにリソースを解放すると解放されます。デフォルトの割り当てが不十分な場合は、割り当ての増加をリクエストできます。

割り当て
プロジェクトあたりのドキュメント数 1,000,000
プロジェクトあたりのデータストア数 100*
プロジェクトあたりのエンジン数 100
プロジェクトあたりの保留中のインポートの長時間実行オペレーションの数 300
プロジェクトあたりの保留中のパージ ドキュメントの長時間実行オペレーションの数 100
プロジェクトあたりのサービス提供制御の数 1,000
サービス提供構成あたりのブースト サービス提供コントロールの数 100
サービング構成あたりのフィルタ サービング コントロールの数 100
サービス構成あたりのリダイレクト サービス提供コントロールの数 100
サービス構成あたりの類義語サービス提供コントロールの数 100
プロジェクトあたりのユーザー イベント数 40,000,000,000

* 技術的な制限により、データストアの最大割り当てはプロジェクトごとに 500 です。データストアがさらに必要な場合は、新しいプロジェクトを使用します。

技術的な制限により、エンジンの最大割り当てはプロジェクトごとに 500 です。エンジンがさらに必要な場合は、新しいプロジェクトを使用します。

リクエストの割り当て

Vertex AI Agent Builder API リクエストには、次の割り当てが適用されます。デフォルトの割り当てが不十分な場合は、割り当ての増加をリクエストできます。

割り当て
1 プロジェクト、1 分あたりの完了したクエリ リクエスト数 300
プロジェクトあたりの会話型検索読み取りリクエスト数(1 分あたり) 300
プロジェクトあたりの 1 分あたりの会話型検索書き込みリクエスト数 300
プロジェクトあたりのドキュメント一括リクエスト数(インライン インポートやパージなど)(1 分あたり) 100
プロジェクトあたりのドキュメントの非同期インポート(Cloud Storage、BigQuery など)リクエスト数(1 分あたり) 5
プロジェクトあたりのドキュメントのパージ リクエスト数(1 分あたり) 100
プロジェクトあたりのドキュメント読み取りリクエスト数(1 分あたり) 300
プロジェクトあたりのドキュメント書き込みリクエスト数(1 分あたり) 12,000
1 プロジェクトあたり 1 日あたりの評価作成リクエスト数 5
プロジェクトあたりの評価読み取りリクエスト数(1 分あたり) 100
プロジェクトあたりの評価書き込みリクエスト数(1 分あたり) 100
1 プロジェクト、1 分あたりの LLM クエリ リクエスト数(検索の要約、マルチターン検索) 60
1 分あたりの保留中の FHIR または BigQuery ストリーミング書き込みの数 6,000
プロジェクトあたりのサンプル クエリセットの数 100
プロジェクトあたりのランキング API リクエスト数(1 分あたり) 500
1 プロジェクト、1 分あたりの推奨リクエスト数 60,000
プロジェクトあたりの 1 分あたりのサンプルクエリ読み取りリクエスト数 200
プロジェクトあたりの 1 分あたりのサンプル クエリセット読み取りリクエスト数 100
プロジェクトあたりの 1 分あたりのサンプル クエリセット書き込みリクエスト数 100
プロジェクトあたりの 1 分あたりのサンプルクエリ書き込みリクエスト数 200
プロジェクトあたりのスキーマ読み取りリクエスト数(1 分あたり) 100
プロジェクトあたりのスキーマ書き込みリクエスト数(1 分あたり) 100
1 分、1 プロジェクトあたりの検索リクエスト数 300
1 プロジェクト、1 分あたりのユーザー イベント バッチ リクエスト(インポートやパージなど) 100
1 プロジェクト、1 分、1 ユーザーあたりのユーザー イベント収集リクエスト数 240
プロジェクトあたりのユーザー イベントの書き込みリクエスト数(1 分あたり) 60,000

ウェブページのインデックス登録の割り当て

[ウェブサイトの高度なインデックス登録] がオンになっているデータストアでは、インデックスに登録するすべてのウェブページが、[割り当て割り当て] リストの [プロジェクトあたりのドキュメント数] の割り当てにカウントされます。プロジェクト内のページ数とそのプロジェクトのページ割り当ては、データストアの [データ] ページの [プロジェクトのページ数と割り当て] フィールドで確認することもできます。

プロジェクトのデータストアにウェブサイトを追加し、それらのウェブサイトのウェブページが原因でプロジェクトの割り当てを超えた場合、ウェブサイトはインデックスに登録されません。データストアにすでにインデックス登録されているウェブサイトがある場合、それらのウェブサイトは引き続き以前どおりにインデックスに登録されます。割り当てのアップグレードはいつでもリクエストできます。

割り当ての増加をリクエストする

通常、割り当てを調整するには、Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。